AIで「ゲームの面白さ」を改革したい!─スクウェア・エニックス三宅陽一郎とLINE佐藤敏紀が議論

昨今ホットワードとして度々取り沙汰される「AI」。実際の企業や製品の中ではどのように導入や活用が進んでいるのでしょうか。

デジタルゲームにおけるAI技術の開発・研究に従事し、日本デジタルゲーム学会理事でもあるスクウェア・エニックスの三宅陽一郎氏と、スマートスピーカーという急成長する新しい領域でAIの可能性を見出そうとするLINEの佐藤敏紀氏が、各業界でのAI活用と、人間とAIの関係性について議論します。

<対談者プロフィール>
株式会社スクウェア・エニックス テクノロジー推進部
リードAIリサーチャー 三宅 陽一郎氏

京都大学で数学を専攻、大阪大学大学院理学研究科物理学修士課程、東京大学大学院工学系研究科博士課程を経て、人工知能研究の道へ。
ゲームAI開発者としてデジタルゲームにおける人工知能技術の発展に従事。国際ゲーム開発者協会日本ゲームAI専門部会チェア、日本デジタルゲーム学会理事、芸術科学会理事、人工知能学会編集委員。著書に『人工知能のための哲学塾』『人工知能の作り方』、共著に『絵でわかる人工知能』『高校生のための ゲームで考える人工知能』『ゲーム情報学概論』(コロナ社)最新の論文は『大規模ゲームにおける人工知能─ファイナルファンタジーⅩⅤの実例をもとに─』(人工知能学会誌 2017年、AI書庫にて公開)


LINE株式会社 Clovaセンター Clova開発室 VA開発チーム
佐藤 敏紀氏

東京工業大学未来産業技術研究所奥村研究室出身。2008年にヤフー株式会社に入社。スペル訂正技術の研究開発に従事。2012年より現在のLINE株式会社に在籍し、自然言語処理・検索・機械学習関連の業務などに携わる。単語分かち書き辞書生成システムNEologdを開発し、成果をOSSとして公開中。近年はClovaの日本語向けの自然言語理解システムを開発している。 情報処理学会 自然言語処理研究会(NL研) 運営委員。人工知能学会編集委員。データ構造と情報検索と言語処理勉強会(DSIRNLP)を主催。近年の趣味はボードゲーム。ガジェット好き。諸々のユーザIDは@overlast。


人工知能でゲーム開発を改革したい

佐藤:論文や人工知能学会で、ずっと三宅さんのご活躍を拝見していました。最近はどんな取り組みをされているんですか?

三宅:ざっくり言うと、ゲーム開発者がやってきた知的作業を人工知能に置き換えるということを今やっています。僕はその中でも、ゲームの品質を保証するAIの開発に取り組んでいます。

▲株式会社スクウェア・エニックス 三宅 陽一郎(みやけ・よういちろう)氏

佐藤:ゲームの品質保証というと、面白さの保証ということですか?その前段階の仕様を満たす部分ということですか?

三宅:手堅く実現したいのは、後者の仕様部分です。これまでの30年間くらい、宿屋に泊まったらちゃんとお金が減るかとか、敵の攻撃は仕様通りかとか、そういう仕様を大量のデバッガーさんを投入してひたすらプレイしてデバッグしていました。その部分を僕は人工知能によって改革したいと思っているんです。

ゲームの面白さは各企業の競合する部分ですけど、品質保証は直接競合ではないので、僕は業界全体で取り組んでいけるのではと思っています。学術界も入りやすいので、企業と学術界と連携して推進できないかということを試みているところです。

佐藤:企業と学術界と連携できたら導入が進んでいきそうですね。

三宅:一方で、ゲームの面白さの面での品質保証についてもAIやデータ解析の活用が進んでいます。

「ゲームの面白さ」にメスが入る時代へ

三宅:2~3年前までは、ゲーム業界では「ゲームエンジンをどうやって上手く作るか」という争いが主だったんです。ところが今は、各ゲーム会社がそれなりのゲームエンジンを作れるようになって、その争いはほぼ終わりました。

それによって現在は、ゲームエンジンの上で動くゲームデータがたくさん取れるので、ゲームがどう動いているか、ユーザーがどういうプレイをしたか、データを解析してゲームがちゃんと面白くできているかを検証するという時代に入ってきました。

佐藤:ゲームデザインにおけるメイントピックがデータ解析に移ってきたんですね。

三宅:今年のGDC(※)でも、ゲームデザイナーとデータサイエンティストが一緒に登壇して、ゲームプレイによって蓄積したデータを解析したグラフをもとに「このゲームはこういう風にできているから面白い」と喋るようなものが多かったです。

これまでのゲーム制作は、データの蓄積ができない以上、大げさに言うとゲームデザイナが「俺の言うことを聞け、そしたら面白くなるから。」ということを言いっぱなしにならざるを得なくて、ゲームのヒットする要素を科学的に検証することが難しかったんです。

※GDC…GameDevelopersConference。毎年初春にアメリカで開催されるゲーム開発者向けのカンファレンス。

佐藤:データ解析が進むことである程度の数値化ができてゲームが開発しやすくなったと感じる人と、逆にこれまで通りのやり方ができず不自由に感じる人と、両方の発想がありそうですね。

三宅:「感性でゲームデザインする人」と「理詰めでゲームデザインする人」の二者あるので、少なからずあると思います。例えば「ここに風車を置いたら絶対面白いから!」と直感に従ってデザインして、たしかになんとなく面白い気がすると。でもその正しさの検証は難しかったんです。

でもデータ解析によって、風車があるのとないのでどう違うとか、どのくらいの頻度でクリアされているとか、いろいろなデータグラフが取れて解析できるようになった。一見地味かもしれませんが、ゲームの歴史の中でゲームデザインに直接、科学のメスを入れられるのは初めてなんですよね。面白い時代になったと思います。

佐藤:昔はハードウェアやシステムのスペックなどの制約もありましたけど、それが進化したこともAI導入の促進に寄与していそうですね。

三宅:はい、ある程度までは、制約をほとんど気にしなくていいレベルになっています。開発者がしていた知的作業をいかにAIに置き換えるかということを突き詰めていけば、ゲームは進化する。ゲーム会社がやることがなにもなくなったら成功です。最後に残るのは主にゲームとデザインのコンセプトの創造で、それがゲーム開発者に本当に残る仕事だと思っています。

佐藤:コンセプトさえあればゲームができあがるっていうのは、開発者としては少し怖くないですか?

三宅:でも、最終的にはそういう風になると思います。純粋なアーティストがゲームを作り、エンジニアも仕様通り作ることから解放されて面白いことに集中出来る。そしてデータは集められ続けると。そんな時代が来ると思いますね。

佐藤:なるほど。僕の知らなかった視点なので、すごく面白いです。

ユーザーの入力に制限がないスマートスピーカー

佐藤:僕は「Clova」というスマートスピーカー向けのAIアシスタントの、言語理解のパートを立ち上げ期から1年半ほど担当しています。ユーザーがスマートスピーカーに話しかけて入力された言葉から、ユーザーが何をやりたいかを解析して後続のパートに伝えてあげる部分です。

三宅:スマートスピーカーを開発するチームって世界中でもまだそんなにないと思うんですが、難しいと感じる部分ってありますか?

佐藤:難しいのは、ユーザーが入力するキーワードが限られていないという部分ですね。思った言葉をいくらでも入力できるようにしないといけない。

例えば「天気を知りたい」という事象に対しても、「今日の天気は?」「今日晴れる?」「天気」とユーザーによって呼びかけも様々ですし、位置情報も入ってくる。同じユーザーでも、朝や寝る前、昼間の元気なとき、体調のいいとき悪いときでも呼びかけ方が変わってきます。

参考: AIに「Clova、今日の天気は?」を理解させることの面白さ│LINE Engineering Blog

▲LINE株式会社 佐藤 敏紀(さとう・としのり)氏

佐藤:キーワードを限定していない状況ですと、そもそも検索対象を絞り込んでいくのもなかなか難しいです。例えばよく利用される「曲をかけて」というリクエストでも、かけてほしいアーティストの対象は数百万、曲の対象は数千万とあるので、再生すべきアーティスト名と曲名の組み合わせの候補にたどり着くのまでの組み合わせがすごく多いんですよね。

三宅:対象が数百、数千万とある場合はどうやって絞り込んでいくんですか?

佐藤:音楽の場合は、まずは入力されたキーワードに含まれる曲名やアーティスト名を抽出します。うまく抽出できない場合は、音楽クエリを処理するための検索エンジンで検索して、そこで1番ニーズが合う曲やプレイリストを返してあげる風になっています。

三宅:そういう、各ジャンルに対応する検索エンジンが用意されているんですか?

佐藤:はい。オープンソースの検索エンジンをなるべく活用して用意しますが、それをClovaとつなぐ部分は独自に開発しています。

三宅:それは1年半の開発期間ではすごく大変そうですね。

佐藤:時間も人もなかなか足りないですね。ゲームのキャラクタAIが必要とする機能を考えると、全然足りない要素や、完璧でない部分もあるんですが、まずは確実にお客様の役にたつことを考えて、地道に開発を続けています。

三宅:逆に他のサービス開発と違って面白みを感じるのはどんなところですか?

佐藤:プラットフォームを作る側であるという点ですね。アプリ開発とかスキル開発とか、プラットフォームを使う側の開発は多いですが、作る側になれるのはこの立ち上げの時期にしかない。開発する上での自由度が高くクリエイティビティを発揮しやすい環境なのでやりがいを感じます。

三宅:なるほど。自由度が高いのは面白そうです。

佐藤:言葉のやりとりをする特性上、サーバサイドエンジニアリングにおいても、ユーザーインタフェースに近い部分になるのも面白いと思います。アイデアを持った人がどんどん作っていって、開発が柔軟ですね。

ゲーム世界の会話は狭めざるを得ない

三宅:Clova開発の以前から、LINEでは人工知能を活用する取り組みをされていたんですか?

佐藤:Webアプリケーションでは、AIを使ってBI(business intelligence)としてデータを集計して可視化や多角的な分析をしてきました。LINE GAMEでも、必要な箇所にAIが導入されています。

コミュニケーションアプリ「LINE」でも、ユーザー同士の会話内容は一切解析しませんが、解析可能な部分についてはML(Machine Learning)に特化した部隊が解析してより便利に利用できる機能の開発を進めてきました。ただ、人工知能的なアプリケーションを前面に立たせるのは初めてかと思います。

三宅:これまでのデータ解析やAIのノウハウが、Clovaの開発によってより高められているイメージですか?

佐藤:LINEの親会社である韓国のNAVERでは検索エンジンを運営しているので言葉の解析についてのノウハウはあったんですが、日本語で再現するデータがなかったんです。現在はClovaをリリースして、ユーザーがリクエストする話し言葉とClovaが返す話し言葉のデータがどんどん貯まっている。実際にやってみていく中でやってみないとわからなかったことがどんどんわかっていく途中というところです。

三宅:なるほど。それだけの会話データが集められるのは羨ましいですね。ユーザーの入力する言葉に制限がないスマートスピーカーに対して、ゲームはストーリーや世界設定があるので会話の幅を狭めざるをえないんです。

例えば「あなたは勇者で、3時間後にお姫様を助けに行くので装備を揃えてください」という前提があり、町の人と会話をする。すると町の人の会話はある程度それに沿ったものになります。3~4種類用意したとして、ある程度のバリエーションがあるにせよ、自由な会話ではないですよね。

佐藤:RPGで逸脱した遊び方をしようとしても、NPCと会話をしたらストーリーが進んでしまうとかありますよね。

三宅:フラグ管理などもあり、クオリティも担保しないといけないので、ある程度決め打ちで用意してしまっています。

佐藤:現実世界のバーの様に、何度も通ってマスターと仲良くなると秘密を教えてくれる、みたいなルールは、ゲームだと設定しづらいですね。

三宅:そうなんです。開発者としてやりたいことはあっても、なるべく途中でやめてもらわないというのが重要なので自由度を狭めざるをえないんですね。ただ、AIの技術を使ってユーザーのプロファイルを解析して、いつどこでどんなプレイをしたから関連した会話を生成するということはある程度できると思っています。

例えば、ずっと洞窟にこもって戦闘をしていたので、武器屋に入ったら「その武器もうボロボロだよ」というような、穴埋めのような会話ですね。データを取れば取るほど、会話にバリエーションが出てくるようになる。

佐藤:ユーザーの状況をちょっと付け足すことで、会話のリアルさがグッと増しますよね。

三宅:心理面の情報も取ることができれば、短い会話でも思い切ったことができると思うんですけどね。

ユーザーの状況を反映することで会話のリアルさが増す

佐藤:たしか三宅さんが、「ゲームをプレイしていないソーシャルネットワークの状況をゲームに反映することは、将来的に実現の可能性がある」とお話しされていましたよね。ゲーム開発にはユーザーの心理を解析するのに特化したようなチームもあるんですか?

参考: [Unite]AIの進化はゲームデザインとプレイヤーにどんな影響をもたらすのか。セッション「ゲームAI・ゲームデザインから考えるゲームの過去・現在・未来」をレポート

三宅:弊社にはないんですが、心理学的な解析に取り組んでいる会社もあります。アメリカのValveという会社では社内に生理学者がいて、ゲームしているときの生理的な情報をとってゲーム開発に活かす研究をしています。日本でも、学術界では生態情報をゲームデザインにフィードバックして活用しようという流れがあります。

心拍数が上がったら敵を出してみて、そうするとまた心拍数が上がるので敵が出現して、アメーバ的に増えて盛り上がるとか(笑)ゲームに反映する以外にも、医学的なアプローチも考えられるし、コントローラに生態デバイスがつけばゲームデザインに活かすことができますね。

佐藤:ゲームはユーザーがある程度連続した時間プレイするので、状況に合わせてインタラクティブにコンテンツを変化させやすいタイプのメディアですよね。スマートスピーカーとユーザーとのやりとりはある瞬間にだけ発生するので、使っていない間にユーザーがなにをやってたのかを把握したり、予測したりするのが大変です。

三宅:ゲームではコンテクストってすごく重要で、今自分がなにをやっているかがわかると、プレイヤーは安心してプレイを続けられるんです。今はレベル上げをしていて、このくらいやれば次のステップだぞと。

スマートスピーカーのようにいきなり会話が始まる場合、読み取りづらくて難しそうですね。例えば何歳で、どんな職業で、平日だけどたまたまお休みで家にいて、どんな悩みを抱えていて、そういうコンテクストを拾えたらいいですよね。

佐藤:そうですね、ユーザーの暮らしをモニタリングできるようなスマートスピーカーデバイスはまだないですから。これから画面やカメラがついたデバイスが広く普及して、性別やジェスチャーなどのデータをユーザーの許可する範囲で取得できるようになれば、より状況を把握した上で意思を推定できるようになっていくと思います。

三宅:学術的な話ですが、あらゆる知能というのはコンテクストを持たざるを得ないんです。そして人間は、自分のことを理解してくれるものを信頼し、好きになる傾向があります。AIがユーザーの機微なコンテクストを拾うことができれば、人間はAIに親近感を持つようになってくれますよね。「今日はお仕事お休みですか?」と理解してくれたら安心する。そういう会話をできるようになりたいですね。

⇒ 続編「AIはできるだけ人間に近い方がよい?海外と日本に見る人工知能感の違い」に続きます!

取材・執筆:dotstudio, inc. ちゃんとく

大学までは文系で法学を学んでいたが「モノを作れる人」に憧れて知識ゼロからWebエンジニアの道へ。転職し現在はIoT中心のエンジニア・テクニカルライターとして活動。Node.jsユーザグループ内の女性コミュニティ「Node Girls」を主催。Twitter: @tokutoku393 / dotstudio, inc.


あなたにおすすめ

すべての人にインターネット
関連サービス