資料工程師的日常
open-menu closeme
Home
Technical
Life
About
github linkedin rss
  • 台灣資料工程師職場觀察 (2024)——資料領域的改變與困境

    calendar 2024-06-06 · 1 min read · Data Engineering Career Data
    台灣資料工程師職場觀察 (2024)——資料領域的改變與困境

    在過去一年的觀察下來發現有許許多多的公司或集團,當跨過數位化的門檻且資料量成長到一定程度以後,建立一個 Data Team 就變成許多公司會認真考慮的選項了,但在此時也遇到了許多的困境。


    Read More
  • 論文選讀 — Detecting Spacecraft Anomalies Using LSTMs and Nonparametric Dynamic Thresholding

    calendar 2021-04-19 · 2 min read · Machine Learning Data Engineering Data Paper
    論文選讀 — Detecting Spacecraft Anomalies Using LSTMs and Nonparametric Dynamic Thresholding

    一般的異常偵測 (Anomaly Detection) 系統中,最基礎的就是用靜態閾值 (Static Threshold) 來作為判斷異常的基準,如記憶體使用率超過 85%、硬碟使用量超過 90% 等,但時常需要有經驗的人提供一個「看起來合理的範圍」。本篇是由 NASA 噴射推進實驗室所發表的 paper,示範了他們使用的動態閾值的方法 (Dynamic Threshold)。 如果用在產品中的話,應該可以在說明中加上一行告示「本系統包含 NASA 噴射推進實驗室之技術」


    Read More
  • 台灣資料工程師職場觀察與回顧 (2021)

    calendar 2021-02-27 · 1 min read · Data Engineering Career Data
    台灣資料工程師職場觀察與回顧 (2021)

    幾年來也寫了一些文章,但好像從來沒有好好自我介紹過,因此想要寫一篇文章作為對自己目前經歷的總結,以及分享我對這領域職場的看法。


    Read More
  • 拋棄混亂無章的工作排程-使用 Airflow 管理

    calendar 2020-06-24 · 3 min read · Programming Data Engineering Data
    拋棄混亂無章的工作排程-使用 Airflow 管理

    你是否有許多工作依靠 crontab 來管理,結果除了四散各處難以管理外,許多有相依性的功能又沒辦法保證順序?明明前一個工作失敗了,後一個依舊開始執行,結果使修復工作更加複雜? 這個時候 Apache Airflow 也許就是你的好選擇。


    Read More
  • RE: 從零開始的 Data Pipeline(一) — Data Collector

    calendar 2019-01-22 · 3 min read · Programming Data Engineering Data
    RE: 從零開始的 Data Pipeline(一) — Data Collector

    哈囉,大家今天過得好嗎?在 Data Pipeline 這系列的上一篇文章中已經介紹過了整個 Data Pipeline 大概長什麼樣子?會有哪些需要用到的東西?如果還不熟悉的可以先去看一下。 這篇將會專門介紹 Data Collector 這個角色。


    Read More
  • RE: 從零開始的 Data Pipeline—序章

    calendar 2018-08-13 · 1 min read · Programming Data Engineering Data
    RE: 從零開始的 Data Pipeline—序章

    對於許多軟體服務來說,Log 是一種埋藏的金礦,甚至對於廣告平台來說更是直接關係到營收多寡的東西,因此如何建立穩定可靠的 Data Pipeline 就成為一件非常重要的事情,本文將介紹如何從零開始建構整個流程。


    Read More
  • 簡易趨勢性分析報表-使用平均數與標準差

    calendar 2018-08-11 · 1 min read · Programming Data Engineering Data
    簡易趨勢性分析報表-使用平均數與標準差

    在監控整體服務營運成效時,一直有個疑問是「單從純量的圖形來看時,我實在看不出每天有什麼不一樣」以及「當不同事件相差數十倍時,我沒辦法在同一張表看出兩者各自的變化,更無法看出彼此間是否有什麼關聯」。 想了許久以後我那連入門都算不上的統計知識突然派上用場了,使用了最簡單的平均數與標準差。


    Read More

Luke Hong

Software engineer in data with 4 cats.
Read More

Featured Posts

  • 台灣資料工程師職場觀察 (2024)——資料領域的改變與困境
  • 論文選讀 — Detecting Spacecraft Anomalies Using LSTMs and Nonparametric Dynamic Thresholding
  • 簡單易懂的現代推薦系統 Recommender Systems
  • 這張發票透露了你的什麼訊息?
  • 論文選讀 — Real-Time Personalization using Embeddings for Search Ranking at Airbnb

Recent Posts

  • Adobe LightRoom 的替代選項
  • 我三十歲的時候(中)——生存回報
  • 我三十歲的時候(上)——毀滅與重生?
  • 夢境 – 執政官
  • 我的 2021 回顧
  • 台灣資料工程師職場觀察與回顧 (2021)
  • 我與焦慮症共構的生活近況
  • 拋棄混亂無章的工作排程-使用 Airflow 管理
  • 篩選資料用的 SQL Join : Left Semi, Left Anti
  • 關於射箭這運動(四) – 如何選購複合弓

Categories

TECHNICAL 20 LIFE 13

Series

ABOUT-ARCHERY 4 DATA-PIPELINE-FROM-SCRATCH 2 LINE-BOT-SDK 2

Tags

DATA 13 PROGRAMMING 13 HOBBY 8 DATA ENGINEERING 7 MACHINE LEARNING 6 ARCHERY 4 PYTHON 4 PHOTOGRAPHY 3 YEAR REVIEW 3 CAREER 2
All Tags
ARCHERY4 CAREER2 DATA13 DATA ENGINEERING7 DEPRESSION1 DREAM1 HOBBY8 MACHINE LEARNING6 PAPER2 PHOTOGRAPHY3 PHP1 PRIVACY1 PROGRAMMING13 PYTHON4 SCUBA DIVING1 SQL2 TRAVEL2 UNIT TEST1 YEAR REVIEW3
[A~Z][0~9]
資料工程師的日常

Copyright 2017-  資料工程師的日常. All Rights Reserved

to-top