フルサイクル・データ・エンジニア

って言葉を最近思いついたのだが、調べてみたら求人票の中にはすでにあるようだ。

【フルリモート可】Snowflake Data Superhero在籍｜モダンデータスタックを牽引するフルサイクルデータエンジニア - 株式会社Finatextホールディングス

元ネタは、ベンチャー企業の人間がみんな大好きな、Netflixの「Full-Cycle Developer」の考え方である。

ドメインごとに構成された個々の開発チームが、デザインから実装、デプロイ、サポートまでのソフトウェア・ライフサイクル全てをカバーする働き方をする
中央集権的に集まった専門性の高いチームが、複数のチームで利用するツールを作り、車輪の再発明を防ぐ
Time to Valueの最適化を図るための構成となっている

Full Cycle Developers at Netflix — Operate What You Build | by Netflix Technology Blog | Netflix TechBlog

データエンジニアリングにおいても話は同じだ。中央集権的に集まった専門性の高いチームがいる企業は稀だと思うが、同様の働きは外部のサービスから得ることもできる。dbtやFivetran、Apache Airflow、Google BigQueryやSnowflakeなど、優れたModern Data Stack¹が登場したことにより、複雑で手のかかる技術は「向こう側」に隠蔽された。技術は抽象化され、結果的に個々のエンジニアのアウトプットは増大した。データエンジニアリングにおけるライフサイクルは、元となるデータの生成、データの保存、DWHへのデータの取り込み、データの変換、エンドユーザー向けの提供まで流れとして捉えることができる²。適切な技術を選択できれば³、少ない人数のデータエンジニアリング・チームであっても、フルサイクルに取り扱うことは現代では十分可能だ。

何より、データを利用する人間から来る要望は大体抽象的なものだ。リテラシーにもよるが、「このデータが見たい」「BI上でこの条件でフィルターしたい」くらいの、ふんわりした要望が来ることが多い。そういう要望に直接あたろうとすると、どうしてもフルサイクルになりがちだ。SQLをどう書くかは向こうにとっては知ったことではないからだ。単純に人が少ないから、俺が3人分になる…みたいなことも稀によく起こる。

要望に直接当たって、最適なやり方を考える自由がある働き方が開けているわけだ。コトにあたるのが好きな人間にとっては良い傾向だろう。目の前の人間や要望と向き合い、問題解決に向けて動く自由と力のある時代だ。存分に腕を振るえばいい。一方で、テクノロジー好きな人間にとっては厳しいかもしれない。SQLを書いてばかりいるわけにはいかない時代になったのだから。技術に触れるのが好きなら、別の働き方を考えるのが良いのかもしれない。

優れた抽象化を行う、データエンジニアリング関連技術の総称。境界は不明瞭であり、検索してみると各社が自分のプロダクトをModern Data Stackの枠の中に入れようと必死でSEOしている様が見て取れるだろう。 ↩
データエンジニアリングの基礎 ―データプロジェクトで失敗しないために第二章より ↩
この仮定がかなり強力であることは承知している。私から言えるのは、意思決定の場にいることが重要であるということだ。政治から逃げてはいけない。あなたが適切な情報を知っているなら、あなたは意思決定の場に居て、発言するべきなのだ。この観点で優れたブログ・エントリを見つけ、翻訳したので、リンクを貼っておく。政治から逃げるな - Matheus Lima ↩

現実モデリング

エクスプローラー

フルサイクル・データ・エンジニア

グラフビュー

現実モデリング

エクスプローラー

フルサイクル・データ・エンジニア

Footnotes

関連する記事

BigQuery, SQL, dbt, データエンジニアリング

BigQuery, Fivetran, Snowflake

BigQuery, Snowflake, データエンジニアリング

BigQuery, SQL, Snowflake

BigQuery, Snowflake

Snowflake

BigQuery

SQL

データエンジニアリング

Share

グラフビュー