OnLine

OnLINE
LINEでは、こうしてます。
LINEのなかみ

データサイエンティストが語る、LINEのデータの魅力と可能性

LINEで生まれる新しいアイデアやサービスを支える部門・チームを紹介する「LINEのなかみ」。今回は、LINEの多様なサービス価値の最大化をデータ分析によって実現するデータサイエンティストの仕事について、3名のメンバーからその業務内容や体制などを紹介してもらいました。

ーーまずは自己紹介をお願いします。

今井

LINEには、2019年4月に新卒として入社しました。入社前は、大学院の情報工学系の研究科に所属していて、スマートフォンアプリから取得される位置情報などのデータからユーザーがどういった移動のパターンを持って、どういった場所に移動するのかということをモデリングする研究を行っていました。いわゆるビッグデータ分析の研究だったのですが、それが面白くて仕事でもビッグデータ分析に携わりたいと考えてLINEを選びました。入社後は、LINE MUSICのデータ分析や、LINEの各種サービスから取得される位置情報の分析などを行っています。

谷川

私も学生の頃からデータから知見を見つけてサービスに生かすことに興味があって、マーケティング関連のデータ分析コンペティションや複写機の共同研究などに取り組んでいました。新卒では、某Web企業に就職し、3年ほどECサイトの分析を担当していました。LINEに興味を持ったキッカケは、仕事で聴講しに行った国際会議でした。そこで今のチームメンバーに会って、お話を聞いている中で、多くのデータサイエンティストと近い場所で仕事ができる環境があると魅力を感じて、2019年5月にLINEに転職しました。今は、主にLINEスタンプ関連の機能を担当しています。

吉永

私は学生時代には、超対称性を持った素粒子理論の研究をしていました。素粒子物理学はいわゆるビッグデータ解析の走りとなった分野で、膨大な実験データから理論を検証するためにデータ分析や機械学習の技術が古くから活用されていました。

研究を続けていく中で、今後ビジネスでそのような技術を活用していくことがおもしろそうだと考えて、データ分析を専門とする会社に入社しました。そこでは、Web系や製造業の顧客向けのデータ分析や機械学習プロジェクトに携わっていました。個人的にはより専門性を伸ばしていきたいと考えていたのですが、マネジメント業務が徐々に増えていきまして、転職を検討し始めました。

そんな中で、LINEには技術者として専門性を高めていくキャリアパスがあって、マネージャーにならなくてもちゃんと評価される環境であることを知り、魅力を感じました。入社したのは、2018年2月です。入社後はLINEスタンプやLINEアプリのウォレットタブの分析に1年ほど携わり、現在はLINE広告やLINE公式アカウントなどのB2B領域でデータ分析や機械学習の業務に携わっています。また、2020年2月からは機械学習チームを兼任し、11月からは機械学習チームに主軸を移して機械学習システムの開発も行っています。

ーーデータサイエンティストしてのご自身の役割や業務内容について教えて下さい。

今井

データサイエンティストの役割をざっくり言うと、意思決定や業務改善をデータ集計や分析によって支援することです。もしかしたら人によって業務範囲が異なるかもしれませんが、施策を良くしていくための分析や、推薦システムやUIなどのA/Bテストの設計・評価、「データが仕様どおりに取得できているか」「分析に耐えうるものであるか」「どんな分布をしているか」「どんな活用ができそうか」などを検証する基礎的な分析などが、大まかな業務内容です。

どのような業務内容が比重的に多くなるかは、担当しているプロダクトの状況や事業フェーズなどによると思います。例えば私の担当しているLINE MUSICは既に多くのユーザーが利用しているので、施策を良くしていくための分析の比重が大きいですね。施策を実施した場合の効果を試算する実施前の分析、事業側が必要なときに必要なデータを見られるようにするダッシュボードの作成、施策が試算通りにいった原因・いかなかった原因は何か、またより効果を高めるには何をすれば良いかを突き止める実施後の分析などに注力しています。

集計や分析以外にも、LINEアプリのホームタブやトークタブに出る情報欄のSmart Channelにおいて、どのユーザーにどんなコンテンツを出すかというアルゴリズムの検討や実装も担当しています。

今井さん.jpg

谷川

私も同じような役割を担っています。モジュールの効果測定やユーザー行動等に関する分析、A/Bテストの設計や評価、プロジェクトのKPIツリー作成、指標を確認のためのダッシュボード作成、新しいモジュールのログ定義・ログが正しく落ちているかどうかの確認などが、日々多くの時間を割く業務になります。

具体的に話すと、私は今LINEスタンプ関連の機能としてスタンプキーボードの分析を行っています。スタンプキーボードとは、LINEアプリのトークルーム内でスタンプや絵文字を送ったり選んだりする時に利用するキーボードのことです。プロダクトの目標としては、今よりもさらにスタンプや絵文字を利用してもらいユーザーのコミュニケーションをより活発にすることなのですが、そのためにはユーザーが快適にスタンプを探せて送れるといった利便性も重要になってきます。現在は目標に向けて、スタンプ・絵文字の利用増加や利便性を考慮したプロジェクトのKPI設計・ダッシュボード作成や、ユーザーがどうしたらスタンプを使いやすいかなどの行動分析を行っています。

また、スタンプ関連のA/Bテストの設計や評価も行っています。具体的には、A/Bテストで見たい効果を検出できる最低限のサンプルサイズを計算したり、検定手法やユーザー行動関連の指標を用いて、テストの良し悪しを測るためにテストの評価を行っています。LINEスタンプ自体はかなり初期からある機能ですが、スタンプの種類や送信量も増えていて、データをうまく活用することで、まだまだ事業を伸ばしていけるサービスだと感じています。データの種類や量も豊富なので、様々な視点から分析できることにやりがいを感じています

吉永

私は、機械学習チームでデータサイエンスを行う「ML系データサイエンティスト」のような役割で業務を行うことが最近は多いですね。特にデータサイエンスによる業務プロセスの自動化・効率化に注力しています。具体的に取り組んでいることだと、A/Bテスト関連の分析を効率化するツールやETLを効率化するためのSpark Extension機能を開発したり、異常検知や時系列予測のAPIを開発して広告の指標の異常検知や売上管理に活用に取り組んだりしています。他にも、LINE公式アカウント関連では、メッセージ開封率をもとにしたスコアリングモデル開発とシステム開発(Open Score Targeting)、コンテンツ推薦ロジックの改善分析・実装・検証などが業務の例です。

他の事業と同じく、広告を中心にしたB2B事業の領域はLINE全社において非常に大事な根幹を支える収益源の1つで規模感も大きいです。わずかな割合の改善であっても与えられるインパクトは大きいので、ほどよい責任感とやりがいを感じながら、日々業務に取り組んでいます。

ーー業務の流れや周囲の部署との関わり方を教えてください。

今井

施策の効果分析やA/Bテストは主に事業部側からの依頼を受けて分析を行っています。ただ、依頼された通りに分析を行うだけでなく、データを見ないと気づかない部分や、より改善できそうな部分がないか検証して、できるだけこちらからも積極的にフィードバックするようにしています。基礎的な分析については、自主的に取り組むようにしています。サービスに活かせそうなものがあれば、事業部側に持っていくこともあります。

私の場合、事業部側にもデータを分析する担当者がいるので、連携して分析に取り組んでいます。分担としては、日々のKPIレポートやアドホックな分析を事業部側の担当者が、LINEアプリなどの他のサービスとの連携に関する分析は私たちData Labs側で行うことが多いです。ただ、タイミングや他の業務の兼ね合いなどで、双方で適宜相談しながら分担を調整することもよくありますね。

谷川

私も、こちらから発案して発生する仕事もありますが、スタンプ事業部から依頼されることの方が多いですかね。特に、A/Bテストの設計・評価や、新しいモジュールの効果測定については、事業部からの依頼がほとんどだと思います。

また、深く携わっているプロジェクトほど、事業部の企画者のニーズやプロジェクト自体の改善点を把握しやすいので、分析の結果からUI改善や方向性を能動的に提案することも多いです。あとは、プロジェクトのKPIツリー作成もこちらから自発的に提案すること多いと思います。KPIの構造をプロジェクトの担当者にただ伝えるのではなく、Slack通知やデータ可視化ツールであるTableauを駆使して、より根付いてもらうように工夫しています。

吉永

私が見ているLINE公式アカウントの機械学習系の仕事は、データサイエンスチーム・機械学習チームのどちらのメンバーとして携わるのかで若干関わり方が異なります。

データサイエンスチームとして関わるときには、自分たちキッカケで動き出すことが多い気がします。もちろん依頼されて動くこともありますが、事業部の企画者や開発者と直接コミュニケーションする中でこちらが提案したものが進んだり。システム開発(Open Score Targeting)やその関連案件も、データサイエンスチームから企画のベースになるような提案をある程度行ったうえで進行しています。

機械学習チームとして関わる場合は、機械学習PM経由で事業部からの依頼を受けることが多く、依頼内容によってはこちらから主体的に提案していくこともそれなりにあるという感じです。最近行ったLINE公式アカウントのコンテンツ推薦ロジックの改善では、改善のための基礎分析から改善案の提案および実装、結果の検証まで一気通貫で担当しました。

他の皆さんもそうだと思いますが、ベースとなるフローや周りとの関わり方はありつつも、ときに自発的に周囲に食い込んだりしながらプロジェクトや状況によって、最適な進め方を都度調整していく感じでしょうか。あまり型にこだわり過ぎない働き方が多いかなと思います。

吉永さん.jpg

谷川

そうですね、ある程度コミュニケーションの相手やフローが決まったプロジェクトもあれば、そうじゃないものもときどき勃発しますね。役割柄、他部署との連携は多い仕事だと思います。私は、担当するプロジェクトの企画者やフロントエンドエンジニア、あとはクライアントアプリ全般の行動データ収集・活用を技術的にサポートしてくれるアプリケーショントラッキングの担当者とコミュニケーションをとることが多いです。

具体的には、例えば企画者とはプロジェクトの方向性やKPIの数値の増減について意見を交わすことが多いですし、フロントエンドエンジニアとは、定義したログが実装上問題ないかどうかの確認や定義したログのチェックを伝えるためのやり取りが多いです。また、あらゆるタスクでログ定義が必要になった時には、事業部側企画者やアプリケーショントラッキングの人と連携して、より良いログの定義を考えていたりします。データの重要性をしっかり理解している各領域で専門性のある人たちとの会話になるので、そこから学びや気づきを得ることも多いですね。

ーーデータサイエンティストとして働く上で、LINEならではの魅力ややりがいはありますか?

吉永

まず、LINEはLINEアプリに限らず国内屈指のユーザー数を誇るプロダクトが多く、データ領域からも大きな事業貢献ができる点が魅力です。データサイエンスによる改善は掛け算なので、事業規模が大きいほど改善幅も大きくなります。規模の大きいサービスでは、売上指標の数%改善であっても数値として大きな売上になることも珍しくないです。これは、データサイエンティスト冥利に尽きることです。

加えて、多種多様なサービスがあることで、色々なことにチャレンジしやすい環境であることも魅力です。私は入社後やりたい仕事の方向性が何度か変化しているのですが、そのたびにチャレンジできるサービス・環境がありました。LINEでやるべきことがなくなったら、別の場所でのチャレンジも常日頃から考えていますが、なかなかその機会が現れてくれません(笑)。まだまだLINEの中にやりたいことがあると思っています。

今井

第一に、データの量やサービス・プロジェクト数が多いことが挙げられます。サービス間の連携施策を行う事ができたり、成熟したサービスやリリース直後のサービスなど様々なフェーズのサービスに関わることができるのは魅力だと思います。加えて、LINE MUSICや位置情報といった現在担当している範囲については、ログ設計や取得契機の検討といったレベルで関わらせてもらえていて、やりたいことに対して必要なデータを自分の手で設計できる環境も魅力的です。

あとは、事業部側もできる限りデータを使ってサービスを良くしたいという熱意を持ってくれていることです。こちらの分析結果を熱心に聞いて貰えますし、それは単純にやりがいに繋がっています。分析が無駄になるということが、あまりありません。

谷川

私は、担当しているのが成熟したサービスなのにも関わらず、プロジェクト内の人数もそこまで多くなくて、私たち分析者とプロジェクト関係者の距離が近いことが魅力的だなと思っています。今井さんが言うように、データを見ようという習慣が浸透しているからか、分析者の声もより通りやすい環境だなと感じます。

また、案件の難易度がそれなりに高いものがあることも楽しいです。事業部のチームから依頼がくるA/Bテストの種類も多種多様で、時には比較対象のユーザ条件や比較方法を気をつけないと、間違った結論が得られてしまうようなものもあります。そういった難易度が高い案件に対して、チームメンバーの力も借りながら、より正確に評価できるように試行錯誤できることも、個人的には魅力的な部分だと思いますね。

今井

私はまだ1社目なので他の企業との比較などはできないのですが、データ分析をする上で必要な環境はかなり揃っていますよね。自社製のツールとしては、アドホックなクエリを実行したいときに利用するPrestoやHive用のWeb UIであるyanagishima、BIツールのOASISなどがあります。その他には、SlackやGitHub Enterprise、Confluence、Jira、Tableau、Jupyter Hub、Rstudio、Airflowなどを使いながら業務を行っています。

先程少し話しましたが、取得するデータについては設計の段階から関われますし、社内の分析ツールも整っている。社内ツールを開発しているエンジニアとの距離が近く、Slackや出社していた頃は口頭でのやり取りで質問や機能の追加などの要望が結構気軽にできます。最近は分析環境の利用者が増えてきて、計算用のクラスタが混んでる時間帯はクエリの実行に時間がかかってしまうことがあるのが玉に瑕だったりします。ただ、こういった部分も常に改善に取り組まれています。

谷川

データ分析ツールの整備がされていて、spark・Rの独自ライブラリが作成されている、効率的にデータの加工ができる環境が整っているのは、本当に助かりますよね。

チームのメンバーも、機械学習・統計関連の知識がある方もいれば、ビジネス寄りのスキルが高い方もいて、それぞれ得意なところが違っているのも面白いです。特に、定例会議での発表や分析資料・スクリプトから、同じ職種で異なるサービスを担当している人の統計手法の応用方法やコーディングを学べたりすることができるのは、良い刺激がある環境なのではないかと思っています。

谷川さん.jpg

吉永

2人がおっしゃっているように、内製の分析環境や分析ツールの充実はデータサイエンティストとして働く魅力の大きなところだと思います。

あと、LINEならではの特徴としては、データ量が膨大が故に非常に大きなコストがかかってしまうため、パブリッククラウドがあまり使われていないことです。前職ではAWSやAzureといったパブリッククラウドを駆使していたため、その点は正直カルチャーショックを受けました。ただし、LINEでは自前でデータセンターを持ち、内製のプライベートクラウド「Verda」を使っていて、特にデメリットは感じていません。今井さんの話にもありましたが、Verdaの開発チームにも何かあれば相談や要望を伝えることもできますし。

ーーLINEのデータサイエンティストに求められるスキルや経験などを教えて下さい。

今井

わかりやすいところで言うと、最低限SQLは書ける必要があります。あとは、関わるサービスに対するドメイン知識があれば、最低限の業務は可能だと思います。ただ、スキルだけではなくて、働くマインドだったり成長や事業貢献への興味のような部分は強く求められるかなと思います。機械学習や統計、ソフトウェアエンジニアリング、ドキュメンテーションなど、自分のスキルを磨くことはずっと継続できます。今働かれている周りの方々も、成長や挑戦にポジティブな方ばかりですし、活躍の幅をどんどん広げていくことが楽しいと思える人が多いのではないかと思います。

谷川

未経験者も採用しているような環境ではないので、最低限の知識スキルがあるという前提においてですが、サービスに貢献したいという思いと、技術や知識を積極的に学びたいというモチベーションがあれば、入社してからでも必要なスキルは自然に身につくのではないかと思います。ただ、どうしてもSQLやPythonやRの言語、Tableauなどのツールを利用することが多いので、このような言語・ツールを利用した経験がある人の方が望ましいんですかね。

吉永

本質的には、科学的な思考力と方法論を身に着けていることが重要だと思います。我々の業務のコアは課題を設定して、解決方法を考案し、結果を検証して次のアクションを決める、それを明確な答えがない中で進めていくという課題解決のプロセスです。これは科学的な思考力と方法論に基づいた研究のプロセスと非常に似ています。研究に限らず、こういった課題解決のプロセスをきちんと回す経験を持っていることが大事です。この基礎ができていれば業務で必要なスキルは後からいくらでも上積みできると思っています。

今井

自分からアクティブに動いて課題発見ができる人がLINEに向いていると思います。常にデータを見続ける分析者視点だからこそ気付ける課題が必ずあるはず、そういった課題を発見できる人が向いているし、求められていると感じます。あと、データ分析をするだけでは意味がないので、分析した結果から人を動かす力があると良いのかなと思います。

谷川

自発性は本当に重要だと思います。だいたい一人1つずつ担当のサービスを抱えているので、自発的に仕事を進められないと何も進まないので。周りのニーズや今後の方向性を考えて、自ら仮説を立てて分析したり、多方面の職種やチームの方々と積極的にコミュニケーションを取れると、よりスムーズに仕事を進められそうだなと感じています。

様々な領域に詳しいメンバーがチームにいることが魅力に感じる人には、本当に良い環境だと思います。多種多様な分析案件に携わることができるので、自分の引き出しを増やしたい人にはおすすめです。

吉永

「技術を通じて事業貢献をする力」という意味の技術力を持っている人が良いですね。

選択肢という意味で技術的にレベルの高いスキル・知識を持っていることは重要ですが、そういった難易度の高い技術も踏まえて最適な方法を選択できる人がより活躍できていると感じます。プロアクティブに課題を発見し、課題に応じて適切な技術や方法を選択し、解決のために周りを巻き込んで自分もしっかり動いていける人が向いているんだと思います。

これは、個人的な想いもありますが、私が一緒に働きたいと思うのは、数学や物理のバックグラウンドを持っている方ですね。私が単にこういう人たちが好きというだけでなく、数学や物理のような知識を身に着けている人が長い目で活躍できると感じているためです。

サービスでの課題は規模やフェーズによって多種多様なため、それらを広く解決できるようになるためには芸の幅が広くなければなりません。そのときに数学や物理の知識が必要で、そういった知識のある人のほうが後々芸の幅が広くなっていくと感じています。私が学びなおしたいと思っている、Gelfand tripleと無限次元Lie代数を教えてくれる人だと最高ですね。

(ogp)メインビジュアル2_1500×790.jpg

ーー最後に、応募を検討している方へのメッセージをお願いします。

今井

LINEは、蓄積されたデータやそれを活かす環境など、データ分析をする上でとても魅力的な職場だと思います。データ分析によって課題解決をしていきたい!という熱意のある方にはぜひ応募していただきたいです。

谷川

少しでも気になる方は、ぜひ当社のカジュアル面談や採用面接を受けていただいて、LINEのデータ分析の面白さを感じていただきたいです。

吉永

LINEのデータサイエンスに興味を持たれた方、応募をぜひ!一緒に働けることを楽しみにしています。

*

桃木 耕太

2013年にLINEに中途で入社、今は開発組織と採用組織でWebサイト/コンテンツやイベントの企画/制作などをしてます。