OnLine

OnLINE
LINEでは、こうしてます。
INNER VISIONS

LINEのAIがNO.1になる理由

LINEでは、事業を加速し、新たな「WOW」を生み出しやすくするために、2019年2月から「カンパニー制」を導入しています。

いま社内では、各カンパニーのリーダーたちが思い描くビジョンを紹介する、社内報 連載企画「INNER VISIONS」を展開中。今回は、その一部をみなさんにもお届けします。

2020年、LINEはどこへ向かおうとしているのか、そのためにどんな工夫をしているのか、どんな苦悩や葛藤があるのか。生々しい部分もありますが、今後のキャリアの参考になればうれしく思います。

連載企画「INNER VISIONS」、第3回はAIカンパニー。

company_ai

AIカンパニーは、AIアシスタント「Clova」をはじめ、音声操作だけで目的地設定やLINEの送受信などが可能な「LINEカーナビ」、LINEが開発・保有するAIチャットボットや文字認識などのAI技術を企業向けに提供する「LINE BRAIN」など、これらの技術を通じ人々の生活を豊かにするサービスを展開しています。

今回は代表する下記のお二人に、AIカンパニーの今後のビジョンについて話を聞きました。

  • カンパニーCEO:砂金信一郎
  • AI事業企画室 室長:和波豊

AI_2shot

左が和波、右が砂金。

「ひとにやさしいAI」

――それでは、最初の質問です。

Q1. 「Life on LINE」のもと、AIカンパニーはLINEプラットフォームの中でどんな役割を担っていくのでしょうか。

砂金

まず、LINEがAIをやるのは「意外だ」という声もあるようですが、私としてはそう思われるほうが逆に意外です。他のグローバルサービスにおいても、「コミュニケーション」から始まって「AI」に行き着き、そのマネタイズとして「FinTech」をやっている。

データを使ってより良いものを作っていこう、その手段としてAIを活用しようというのは、2020年現在、たぶん地球上のみんながやっていることですから、LINEがAIをやるのも、そんなに突飛なことではないと思います。

02_IMG_6318

砂金

AIカンパニーのミッションは「LINEのサービスの中で動いているAIを見える形にして切り出し、社会にもっとわかりやすく伝えていく」こと。

AIカンパニーが全てのサービスをゼロイチで作り上げるというよりは、これまでにLINEが貯めてきたノウハウやデータ、ユーザーとの信頼関係を使って、より良いAIを作っていこうというスタンスです。

――LINEのAIの強みって、どんなところにあるのでしょうか。

砂金

我々が開発したAIで医療画像を解析する、みたいなものじゃなくて......、舛田さん(LINE株式会社取締役)が「LINE CONFERENCE 2019」の時に言っていた、「ひとにやさしいAI」が言い得て妙だと思っています。

例えば、スマートスピーカーのClova Friendsシリーズって、目と鼻と口がついていたりするでしょう。ユーザー目線でやさしく語りかけますよね。ClovaにせよLINE BRAINにせよ、「何か困っている人たちを、優しく手助けするようなAI技術を提供する」。それがLINEならではのAIだと思います。

今までにないユーザー接点

和波

「AI」って、それ単独のソリューションみたいに聞こえるんですけど、そうじゃなくて。メッセンジャーとかレコメンドの部分など、LINEが提供するサービスの下支えとしてAIが使われているんです。

それと、AIのソリューションは、必ずしもスマホ上で行われる必要がなくて。スマートデバイスもそうですし、既存のオフラインのサービスの中に入れていく方法もあります。そういう意味でも、AIはすごく「Life on LINE」に近いんです。

03_24731b79

「LINE CONFERENCE 2019」の発表スライドより。

砂金

今までClovaは、自社のスマートスピーカーに搭載し、量販店を経由して販売する戦略でした。次はいろんな他社製品の中にソフトウェアとしてClovaを入れていく戦略に舵を切ります。B to B to Cですね。

これによって、LINEがリーチできなかった人にも、我々の技術を使ってもらえるチャンスが生まれます。例えば、「LINE AiCall」は、一般公衆回線からレストランなどに予約の電話をしてきた人に、AIが音声で受け答えするものです。

これで、今までLINEを使う必然性がなかった局面にも、AIという形で入り込めるようになります。電話回線による通話をLINEのAI技術で受けとめることによって、今までとは違ったユーザー接点が得られるんですよ。

いつものサービスにジョイントする

――次の質問に行きましょう。

Q2. AIカンパニーが生み出そうとしている「WOW」とは、どんなものでしょうか。FY20の成長戦略、新たに仕掛ける「WOW」について教えてください。

和波

Clova事業の「WOW」としてまず挙げられるのは、シニアや幼児など、テキスト入力があまり得意ではない方に向けた新サービスの浸透ですね。

シニアの方は音声を主に使う方が多い。テキストだと不安だからという理由で電話をかける方がいますよね。幼児は、まだうまく文字入力ができない場合は、音声入力のほうが使いやすい。そういう方に向けた新しいインターフェイスを入れて、みんなが既存のWebサービスを使えるようにしたいなと。

もう一つは、2019年に出したLINEカーナビですね。今は運転中のタッチ操作が厳罰化されているので、「本当は車の中でやりたかったんだけど、やるとNG」なものをClovaによって可能にしていきます。

――たくさんありそうですね。車でやりたいけどNGなもの。

和波

私の実体験で言うと、家族で土日によくファーストフード店のドライブスルーに行くんです(笑)。家でスマホのクーポンを見つけておくのはいいとして、いざお店に着くとクーポンのセッションが切れていて使えなかったりする。こういうのも、Clovaを通して解消していきたい。

皆さんがいつも使っているサービスにジョイントしていくことで、体験としてより身近に感じてもらえるようになっていくんですよね。この市場では、技術先行でやってもWOWは提供できません。サービスを提供しやすいパートナーと組むのが一番だと思います。

04_IMG_6357

LINEのAIがNo.1になる方法

砂金

我々は「AIテックカンパニーを目指す」と宣言した以上、何兆円もの投資とコストをかけて、AIに本気で向き合っているグローバルテックカンパニーにもAI分野で勝たなければなりません。ただ、LINEにも勝ち方はあると思っていて。

06_AI_Company_2020Q1

砂金

納得感を持っていただきやすい例の一つが、OCR(Optical Character Recognition/光学文字認識)です。これってすごいニッチなんですよ。OCRは英語圏のAI技術者の方々からすると、もう解き終わったタスクで、今そんなに本気で向き合っている人はいないので。だけどアジア圏からすると、文字を読むのって結構大変なんです。

――アルファベットと数字だけの英語圏と違って、日本だと漢字・ひらがな・カタカナとか、文字の種類が多いですからね。

砂金

はい。例えば、この左側の画像。

06_AI_Company_2020Q1

砂金

いろんな標識や看板をできるだけ抜き出して文字認識する、ICDARっていう国際的なコンペティションの課題なんですけど、LINE BRAIN OCRというチームと、OCRが専門じゃないLINE BRAIN VISIONというチームの成績がダントツに良かったんです。

他社のOCRよりはるかに認識率が高い。こういう一点突破できるニッチなところを見つけて、そこだけは他社にも勝てるのというものを、着実に1個ずつやっていけばいい。

普通の米国系外資系企業って、1億数千万人しか使う人がいない「日本語」の重要度があまり高くなくて。英語と中国語は対応するけど、日本語は後回し、というのが現状です。だから我々が先にやってしまおうと。まずは日本語でNO.1を獲る。何でもいいから、屁理屈を付けてでもNO.1をたくさん作っていく。それも戦略の一つかなと。

07_IMG_6304

なぜLINEのOCRは強いのか

――なぜLINEのOCR技術はここまで高くなったのでしょうか。

Q2. AIカンパニーが生み出そうとしている「WOW」とは、どんなものでしょうか。FY20の成長戦略、新たに仕掛ける「WOW」について教えてください。

砂金

質の高い学習用のデータをたくさん用意しているからです。

OCRのなかでも手書き文字の認識は、手書きの文章と、そのテキストデータ――つまり読み取った後の「正解」ですね――それがワンセットになったものをどれだけ多く用意できるかかが鍵で。すごくシンプルな戦いなんですよ。ただ、このデータを作るのがすごく大変で。

そこで我々は逆転の発想をしました。もともとデジタルのテキストデータだったものを、手書き風の書体にしたらいいんじゃないかと。それで、「手書きフォントジェネレーター」というものを開発したんです。

08_AI_Company_2020Q1

砂金

左側が手書き筆跡。右側がそれを元に作った手書きフォントの文章です。よく見ると機械っぽさとがあるかもしれないんですけど、特徴が出てますよね。こういうふうにして、我々は無限に学習用のデータを作れるんですよ。

――すごい。実際にOCR技術はどんなサービスに活用されるイメージでしょうか。

砂金

ちょっと遠いけど、夢のあるところだと、自動運転です。......と言っても、別にLINEグループとして自動運転に参入したいわけではないです(笑)。ドライバーに見えている景色をAIが認識して、人間がいたら感知して停まるとか、標識や看板を読み取って、何か適切なユーザーインターフェイスを提供するとか。

最近は、LINE家計簿の領収書の画像認識をやっています。最初は他社のエンジンを使っていたんですよ。もちろん、それでもいいんですけど。スピーディに改善していくためには内部ツールを使ったほうがいい、ということで内製化したわけです。こういう連携をいろんな部署とやっていきたいですね。

13_IMG_6363

「音声認識」の可能性って?

和波

私も、今のLINEサービスにAIで付加価値が提供できると思うので、社内でディスカッションしていきたいですね。例えば、既存アプリのアシスタント機能として、音声のチャットボットができるようになるとか。

もう一つ、我々はB to B to Cでクライアントと話しているのですが、スマホ用の既存サービスをクライアント側のサービスでも使いたい、という要望は結構あるんですよ。

だから、もう少し新しい視点で、スマホ以外でサービスを提供することも、他のカンパニーと一緒に描いていきたいなと思っています。そうすれば、よりLINEが提供できるユーザーの裾野が拡がりますし、新しいWOWが作れると思うので。

例えば、スマホを持ってない人はLINEデリマが使えないから、電話で出前を頼んじゃう。でもそこで諦めるんじゃなくて、もっといろんな可能性を模索していいと思うんですよね。発想をスマホの中に閉じ込めるのではなく。

砂金

LINEもスマホの中だけの勝負になると、音声認識とか音声合成って、実はあんまりいらないんですよ。諸外国に比べると日本人の音声アシスタント利用者は少なくて。目視で画面をタップした方が便利だから、今はそれを超えられない。

ただ、スマホをポケットやリュックにしまったままの状態で、どこかのお店に行って、自分であることが顔認証か何かの技術で認識されれば、そこで始めてボイスインターフェイスが有効活用されると思います。スマホを出してタップするのではなく、自分がいる空間の中で要望を伝えると、きちんとレコメンデーションしてくれるようなインターフェイス。それを実現するのに音声はすごく大事です。

もともとスマートスピーカーからスタートした技術ですけど、ある空間の中でのボイスインターフェイスをどうデザインするか、というのは、すごく可能性があると思っています。

11_IMG_6267

和波

画面タップが前提のサービスは、LINEに限らず、スマホのサービス全般ですが、「ながら利用」しづらいじゃないですか。

例えば、介護業界のヘルパーさん。作業内容を都度チェックして日誌を付けるようなシーンでは、両手がふさがった状態で作業しているから、「ながら」で日誌を付けるのは大変です。

だったら音声入力で、「お昼ご飯を準備しました」って言えばいい。こんなふうに、スマホが必ずしもベストな形態ではない局面って、いっぱいあります。車を運転する必要のある運送業の方もそうですよね。

技術的な限界と狙うべきニッチ

砂金

ただ、音声認識は技術的な限界もあります。例えば、会議の議事録用の文字起こし。100%は無理ですね。2人での会話ならまだしも、同時に10人が会話すると、誰が何を話しているのか認識できません。

人間は誰が話しているのかを、指向性を持って聞き分けられるんですけど、マイクを通して集めた音声だと判別できないんですよ。そこを分離する技術がない状況では、同時に複数の音が鳴っている状態で聞き分けるのは難しい。なので、そういうことが起こりにくい部分からやっていきます。

先ほど和波さんがお話してたヘルパーさんの音声入力が現実的なのは、言うことが大体決まっているからです。無限の語彙を認識する必要はなくて、「お昼ご飯」「トイレに行った」「お風呂のサポートをした」「薬を飲んだ」といった定型文がある。やることが決まっている領域では、認識の精度を高めやすいんです。

我々はニッチな分野の認識精度を上げて、実務で使えるようにしていけることが、勝ちパターンの一つとして取り得る手段だと思っています。

東アジア人にしか生み出せないAIを

――LINEらしいAI、ということですね。

砂金

ずっと考えているのは、「東アジア人にしか生み出せないAIって何だろう?」ということ。

例えば、日本の「侘び」「寂び」を理解できる感受性の高いAIが完成したら、AIが映像作品を観たとき、空間作品を認識したとき、文学作品を読み込んだときに、他のAIとは違った受け答えができるだろうと。

13_IMG_6363

――面白そうですね。

砂金

この前、脳科学の研究で知られる柳田敏雄先生とお話ししたんですけど、人間の脳って揺らいでいて、何かのタイミングで「ひらめく」ことがあるんだけれども、いわゆる探索型AIの、最適解を見つけようとする観点では、揺らぎの果てにある「ひらめき」にはたどりつけないんだそうです。

今は最適解を見つけること、認識率を最大化することが大事だし、求められているから、それだけをやればいいじゃん――というのが大抵のAI技術ベンダーのスタンスではあるんですが、中長期で見たときに「LINEのAIだけ、ちょっと違う答えを出すんだよね」っていう評価になって、他のAIとは違った心地良い体験が生み出せるのだとしたら作りたいなと。

我々にしか実現し得ないものを、実現したい。まだすごく明確な解があるわけではないですが、「何が我々のユニークネスになっているか」というのは、問いとして持っていますね。

日本企業として日本語に真剣に取り組んだ結果として、例えば海外サービスから「サービスを日本語対応したいんだけど、作る時間もリソースもないから、LINEのエンジンを使わせてほしい」と声がかかる。こうなればみんなハッピーかなと。

「あの時、LINEの人たちが頑張ってくれたから、日本語処理は世界的に見ても他の言語と比べて遅れてないんだよ」って20年後くらいに言われたら、いいですよね。

14_IMG_6392

20年後、今の子どもたちの世代が、LINEのAIの仕事に思いを馳せる――。そんな日が来ることを想像しながら、自分たちのユニークネスを生かしたAI像を、模索し続けていきます。

*

松永 理沙

PR室で社内広報をしています。2019年よりLINEに入社。スピーチやコピーライティング、PRなどの企業のブランド活動に携わってきました。休日は漫画、ゲームばかりで、長男・夫とインドアに過ごしてます。旅行も好きで、関東と中部圏のロープウェイは制覇しました。ダムも詳しいです。