成果物の公開について
本プロジェクトの成果物である自然言語解析(固有表現抽出)AIエンジンのソースコード、開発過程で生成した学習済みモデル、学習用データのサンプル、その他ドキュメントを「DATA-SMART CITY SAPPORO」で公開しています。Apache V2ライセンスのオープンソースのため、営利・非営利を問わず広くご活用いただけます。下記よりダウンロードの上、ご利用ください。
プロジェクトについて
札幌市のコールセンター「ちょっとおしえてコール」には、札幌市のさまざまな制度や手続き、施設、行事、公共交通案内など様々なお問い合わせが年間約16万件寄せられています。このお問い合わせのやりとりや結果は、問い合わせ品質の向上や業務所管部局での業務改善等を目的として、オペレーターがその内容を要約・入力しており、個人を特定できない形の文字情報として記録されています。
この情報には、日本語による「問い合わせと、それに対する応答」の文字情報が大量に蓄積されていることから、AI開発における「学習データ」としての活用の可能性が考えられます。
そこでSapporo AI Labでは、リーディングプロジェクトとして「札幌市コールセンターデータを活用したAI自動応答システム構築実証事業」を下記のとおり実施しています。
概要
- 札幌市コールセンターの問い合わせ履歴を学習データとして活用した、自然言語解析を行うAIを開発することで、問い合わせ履歴データのAIでの活用の可能性を検討します。
- 上記AIをベースにチャットボットを作成。テーマを「札幌周辺の公共交通案内」とし、「さっぽろえきバスNAVI」のシステムを活用したやりとりを行うものとします(※1)。
- モニターによるテストを実施し、AI部分の完成度を評価します。
- 成果物(AIによる言語解析部分)は、交通案内以外の分野でも使える汎用的なものとし、無償で利用できる形で公開(※2)します。(企業による活用やAIラボにおける勉強会のテーマとしての利用を想定)
※1 今回の実証事業は、地場IT企業によるAI開発の試作モデルとして選定しており、今回の試作モデルを用いた公共交通案内サービスを提供する予定はありません。
※2 コールセンターの応対履歴データは、データそのものではなく、学習済みモデルの公開を予定しています。
固有表現抽出とは?
固有表現抽出とは、文書中に含まれる固有表現(人名・組織名・地名・日付表現・時間表現、金額表現、割合表現、固有物名)を抽出する技術です。本実証実験では、地名・交通機関・日付・時間の4つの固有表現を対象としています。
適用技術:Bi-LSTM + CRF
固有表現抽出には、Deep Learningの1つであるBi-LSTMとCRFを組み合わせた方式を使用します。入力文に対する、固有表現予測の概要図を以下に示します。
実証システム
LINEのインタフェースを使用し、問い合わせに対して、さっぽろえきバスナビのAPIと連携し、交通案内の回答をユーザに提供します。
本システムのユーザからの利用イメージは、次の図のような形を想定しています。
評価方法として、システム構築後に行うモニター(100名程度)による評価を予定しています。実生活における市内交通移動の局面や、市内交通移動計画の立案時などにおいて本実証実験で構築したBotサービスを検証していただきます。
将来への期待
本実証実験で開発する固有表現抽出を他分野のデータセットにも適用し、さらにその上に応用アプリケーションを構築することにより、企業や行政の保有するデータを活用したサービスの開発が期待されます。また、札幌市内の企業の技術発展の一端として、本実証実験で開発した技術を公開することによる技術力向上が期待されます。