資料工程師的日常
open-menu closeme
Home
Technical
Life
About
github linkedin rss
  • 台灣資料工程師職場觀察 (2024)——資料領域的改變與困境

    calendar 2024-06-06 · 1 min read · Data Engineering Career Data
    台灣資料工程師職場觀察 (2024)——資料領域的改變與困境

    在過去一年的觀察下來發現有許許多多的公司或集團,當跨過數位化的門檻且資料量成長到一定程度以後,建立一個 Data Team 就變成許多公司會認真考慮的選項了,但在此時也遇到了許多的困境。


    Read More
  • 論文選讀 — Detecting Spacecraft Anomalies Using LSTMs and Nonparametric Dynamic Thresholding

    calendar 2021-04-19 · 2 min read · Machine Learning Data Engineering Data Paper
    論文選讀 — Detecting Spacecraft Anomalies Using LSTMs and Nonparametric Dynamic Thresholding

    一般的異常偵測 (Anomaly Detection) 系統中,最基礎的就是用靜態閾值 (Static Threshold) 來作為判斷異常的基準,如記憶體使用率超過 85%、硬碟使用量超過 90% 等,但時常需要有經驗的人提供一個「看起來合理的範圍」。本篇是由 NASA 噴射推進實驗室所發表的 paper,示範了他們使用的動態閾值的方法 (Dynamic Threshold)。 如果用在產品中的話,應該可以在說明中加上一行告示「本系統包含 NASA 噴射推進實驗室之技術」


    Read More
  • 簡單易懂的現代推薦系統 Recommender Systems

    calendar 2020-06-29 · 1 min read · Machine Learning Data
    簡單易懂的現代推薦系統 Recommender Systems

    在這個資訊超載的年代,使用者有限的注意力也成為各種串流平台、網路廣告、電商等數位服務的兵家必爭之地。這篇文章將會概略的談論推薦系統常見的幾種方式。 本篇內容節錄自我在 DataCon.TW 2019 的分享《推薦系統:從 Data Pipeline 到 Machine Learning》


    Read More
  • 這張發票透露了你的什麼訊息?

    calendar 2020-05-03 · 1 min read · Privacy Data
    這張發票透露了你的什麼訊息?

    前陣子跟同事聊到一個話題,目前 App Store 上面有許多發票對獎 App。但是實體發票掃進去以後,如果中獎了還要想辦法找到那張發票,感覺非常不實用。那麼用了以後有什麼差別嗎?


    Read More
  • 論文選讀 — Real-Time Personalization using Embeddings for Search Ranking at Airbnb

    calendar 2018-09-03 · 3 min read · Programming Machine Learning Paper Data
    論文選讀 — Real-Time Personalization using Embeddings for Search Ranking at Airbnb

    這是我第一次嘗試的系列,因為我工作上也是做推薦系統相關,讀到這篇覺得有很多地方的想法很有趣與實用,因此嘗試寫一篇來介紹。 這篇是 Airbnb 八月底在 KDD 2018 發表熱騰騰的 paper,他們試圖建立使用者與房間的 embedding,以此作為搜尋排序的基準。


    Read More
  • 台灣資料工程師職場觀察與回顧 (2021)

    calendar 2021-02-27 · 1 min read · Data Engineering Career Data
    台灣資料工程師職場觀察與回顧 (2021)

    幾年來也寫了一些文章,但好像從來沒有好好自我介紹過,因此想要寫一篇文章作為對自己目前經歷的總結,以及分享我對這領域職場的看法。


    Read More
  • 拋棄混亂無章的工作排程-使用 Airflow 管理

    calendar 2020-06-24 · 3 min read · Programming Data Engineering Data
    拋棄混亂無章的工作排程-使用 Airflow 管理

    你是否有許多工作依靠 crontab 來管理,結果除了四散各處難以管理外,許多有相依性的功能又沒辦法保證順序?明明前一個工作失敗了,後一個依舊開始執行,結果使修復工作更加複雜? 這個時候 Apache Airflow 也許就是你的好選擇。


    Read More
  • 篩選資料用的 SQL Join : Left Semi, Left Anti

    calendar 2019-12-02 · 1 min read · Programming SQL
    篩選資料用的 SQL Join : Left Semi, Left Anti

    不管是查詢資料庫或是處理資料的 Dataframe 等,相信大家對於使用 SQL 語法 Join 不同資料表的情境都不會太陌生,而最常見的就是使用 Inner Join 與 Outer Join。 但之前也有遇到「不需要拿另一張表的資料,但要用它來過濾特定資料」的情況,這時候就可以考慮使用 Left Semi/Anti Join。


    Read More
  • RE: 從零開始的 Data Pipeline(一) — Data Collector

    calendar 2019-01-22 · 3 min read · Programming Data Engineering Data
    RE: 從零開始的 Data Pipeline(一) — Data Collector

    哈囉,大家今天過得好嗎?在 Data Pipeline 這系列的上一篇文章中已經介紹過了整個 Data Pipeline 大概長什麼樣子?會有哪些需要用到的東西?如果還不熟悉的可以先去看一下。 這篇將會專門介紹 Data Collector 這個角色。


    Read More
  • 羅技 MX ERGO 滾輪在 Mac 上無法使用

    calendar 2018-12-17 · 1 min read
    羅技 MX ERGO 滾輪在 Mac 上無法使用

    今天早上使用來公司時,發現手上的滑鼠滾輪居然無法使用,這對於使用電腦是非常崩潰的事情,後來誤打誤撞解決了問題就來紀錄一下。


    Read More
    • ««
    • «
    • 1
    • 2
    • »
    • »»

Luke Hong

Software engineer in data with 4 cats.
Read More

Featured Posts

  • 台灣資料工程師職場觀察 (2024)——資料領域的改變與困境
  • 論文選讀 — Detecting Spacecraft Anomalies Using LSTMs and Nonparametric Dynamic Thresholding
  • 簡單易懂的現代推薦系統 Recommender Systems
  • 這張發票透露了你的什麼訊息?
  • 論文選讀 — Real-Time Personalization using Embeddings for Search Ranking at Airbnb

Recent Posts

  • Adobe LightRoom 的替代選項
  • 我三十歲的時候(中)——生存回報
  • 我三十歲的時候(上)——毀滅與重生?
  • 夢境 – 執政官
  • 我的 2021 回顧
  • 台灣資料工程師職場觀察與回顧 (2021)
  • 我與焦慮症共構的生活近況
  • 拋棄混亂無章的工作排程-使用 Airflow 管理
  • 篩選資料用的 SQL Join : Left Semi, Left Anti
  • 關於射箭這運動(四) – 如何選購複合弓

Categories

TECHNICAL 20 LIFE 13

Series

ABOUT-ARCHERY 4 DATA-PIPELINE-FROM-SCRATCH 2 LINE-BOT-SDK 2

Tags

DATA 13 PROGRAMMING 13 HOBBY 8 DATA ENGINEERING 7 MACHINE LEARNING 6 ARCHERY 4 PYTHON 4 PHOTOGRAPHY 3 YEAR REVIEW 3 CAREER 2
All Tags
ARCHERY4 CAREER2 DATA13 DATA ENGINEERING7 DEPRESSION1 DREAM1 HOBBY8 MACHINE LEARNING6 PAPER2 PHOTOGRAPHY3 PHP1 PRIVACY1 PROGRAMMING13 PYTHON4 SCUBA DIVING1 SQL2 TRAVEL2 UNIT TEST1 YEAR REVIEW3
[A~Z][0~9]
資料工程師的日常

Copyright 2017-  資料工程師的日常. All Rights Reserved

to-top