資料工程師的日常
open-menu closeme
Home
Technical
Life
About
github linkedin rss
  • 論文選讀 — Real-Time Personalization using Embeddings for Search Ranking at Airbnb

    calendar 2018-09-03 · 3 min read · Programming Machine Learning Paper Data
    論文選讀 — Real-Time Personalization using Embeddings for Search Ranking at Airbnb

    這是我第一次嘗試的系列,因為我工作上也是做推薦系統相關,讀到這篇覺得有很多地方的想法很有趣與實用,因此嘗試寫一篇來介紹。 這篇是 Airbnb 八月底在 KDD 2018 發表熱騰騰的 paper,他們試圖建立使用者與房間的 embedding,以此作為搜尋排序的基準。


    Read More
  • 拋棄混亂無章的工作排程-使用 Airflow 管理

    calendar 2020-06-24 · 3 min read · Programming Data Engineering Data
    拋棄混亂無章的工作排程-使用 Airflow 管理

    你是否有許多工作依靠 crontab 來管理,結果除了四散各處難以管理外,許多有相依性的功能又沒辦法保證順序?明明前一個工作失敗了,後一個依舊開始執行,結果使修復工作更加複雜? 這個時候 Apache Airflow 也許就是你的好選擇。


    Read More
  • 篩選資料用的 SQL Join : Left Semi, Left Anti

    calendar 2019-12-02 · 1 min read · Programming SQL
    篩選資料用的 SQL Join : Left Semi, Left Anti

    不管是查詢資料庫或是處理資料的 Dataframe 等,相信大家對於使用 SQL 語法 Join 不同資料表的情境都不會太陌生,而最常見的就是使用 Inner Join 與 Outer Join。 但之前也有遇到「不需要拿另一張表的資料,但要用它來過濾特定資料」的情況,這時候就可以考慮使用 Left Semi/Anti Join。


    Read More
  • RE: 從零開始的 Data Pipeline(一) — Data Collector

    calendar 2019-01-22 · 3 min read · Programming Data Engineering Data
    RE: 從零開始的 Data Pipeline(一) — Data Collector

    哈囉,大家今天過得好嗎?在 Data Pipeline 這系列的上一篇文章中已經介紹過了整個 Data Pipeline 大概長什麼樣子?會有哪些需要用到的東西?如果還不熟悉的可以先去看一下。 這篇將會專門介紹 Data Collector 這個角色。


    Read More
  • RE: 從零開始的 Data Pipeline—序章

    calendar 2018-08-13 · 1 min read · Programming Data Engineering Data
    RE: 從零開始的 Data Pipeline—序章

    對於許多軟體服務來說,Log 是一種埋藏的金礦,甚至對於廣告平台來說更是直接關係到營收多寡的東西,因此如何建立穩定可靠的 Data Pipeline 就成為一件非常重要的事情,本文將介紹如何從零開始建構整個流程。


    Read More
  • 簡易趨勢性分析報表-使用平均數與標準差

    calendar 2018-08-11 · 1 min read · Programming Data Engineering Data
    簡易趨勢性分析報表-使用平均數與標準差

    在監控整體服務營運成效時,一直有個疑問是「單從純量的圖形來看時,我實在看不出每天有什麼不一樣」以及「當不同事件相差數十倍時,我沒辦法在同一張表看出兩者各自的變化,更無法看出彼此間是否有什麼關聯」。 想了許久以後我那連入門都算不上的統計知識突然派上用場了,使用了最簡單的平均數與標準差。


    Read More
  • 能被電腦理解的文字 NLP(一) — Word Embedding

    calendar 2018-06-27 · 1 min read · Programming Machine Learning Data
    能被電腦理解的文字 NLP(一) — Word Embedding

    我們總是希望有個管家機器人,只要跟他說句話就能幫忙處理大小事,例如做早餐、泡咖啡、傳送訊息,甚至是組裝鋼鐵鎧甲。在語音助手這一方面 Siri、Google Assistant、Amazon Alexa,都在逐步實現我們的夢想。 而在文字處理方面也有了許多的改變,這篇將介紹將文字編碼的方式。


    Read More
  • Windows 上 tensorflow-gpu 出現 CUDNN_STATUS_BAD_PARAM 的解法

    calendar 2017-09-19 · 1 min read · Programming Python Machine Learning
    Windows 上 tensorflow-gpu 出現 CUDNN_STATUS_BAD_PARAM 的解法

    當我在 Windows + Tensorflow-gpu 環境下執行程式時,一直出現 CUDNN_STATUS_BAD_PARAM,以下是我的解法。


    Read More
  • 再戰 Line Bot SDK -接收訊息與回應

    calendar 2017-09-14 · 2 min read · Programming Python
    再戰 Line Bot SDK -接收訊息與回應

    在上一篇文章中,嘗試了使用 Line Bot SDK 進行主動推送訊息,這次要嘗試另一種關鍵的用法—接收與回應訊息。


    Read More
  • 兩天搞懂的簡單 CI(一)-Unit Test

    calendar 2017-06-13 · 2 min read · Programming PHP Unit Test
    兩天搞懂的簡單 CI(一)-Unit Test

    我之前一直想在公司的專案加上自動化測試,但是從建置環境開始就遭遇困難、加上團隊的成員及主管間沒有共識,最後是當時有時程上的壓力在,因此最後只在我自己的專案中加入了簡單的單元測試,確保在出問題時可以較快速的找出問題所在。所以首先我要感謝海總理《克服人心的障礙 跨越自動化測試的門檻》這個 Talk 的投影片,讓我下定決心要建立 CI 的流程。


    Read More
    • ««
    • «
    • 1
    • 2
    • »
    • »»

Luke Hong

Software engineer in data with 4 cats.
Read More

Featured Posts

  • 台灣資料工程師職場觀察 (2024)——資料領域的改變與困境
  • 論文選讀 — Detecting Spacecraft Anomalies Using LSTMs and Nonparametric Dynamic Thresholding
  • 簡單易懂的現代推薦系統 Recommender Systems
  • 這張發票透露了你的什麼訊息?
  • 論文選讀 — Real-Time Personalization using Embeddings for Search Ranking at Airbnb

Recent Posts

  • Adobe LightRoom 的替代選項
  • 我三十歲的時候(中)——生存回報
  • 我三十歲的時候(上)——毀滅與重生?
  • 夢境 – 執政官
  • 我的 2021 回顧
  • 台灣資料工程師職場觀察與回顧 (2021)
  • 我與焦慮症共構的生活近況
  • 拋棄混亂無章的工作排程-使用 Airflow 管理
  • 篩選資料用的 SQL Join : Left Semi, Left Anti
  • 關於射箭這運動(四) – 如何選購複合弓

Categories

TECHNICAL 20 LIFE 13

Series

ABOUT-ARCHERY 4 DATA-PIPELINE-FROM-SCRATCH 2 LINE-BOT-SDK 2

Tags

DATA 13 PROGRAMMING 13 HOBBY 8 DATA ENGINEERING 7 MACHINE LEARNING 6 ARCHERY 4 PYTHON 4 PHOTOGRAPHY 3 YEAR REVIEW 3 CAREER 2
All Tags
ARCHERY4 CAREER2 DATA13 DATA ENGINEERING7 DEPRESSION1 DREAM1 HOBBY8 MACHINE LEARNING6 PAPER2 PHOTOGRAPHY3 PHP1 PRIVACY1 PROGRAMMING13 PYTHON4 SCUBA DIVING1 SQL2 TRAVEL2 UNIT TEST1 YEAR REVIEW3
[A~Z][0~9]
資料工程師的日常

Copyright 2017-  資料工程師的日常. All Rights Reserved

to-top