Bright!FRONTEO Official Blog

Bright!FRONTEO Official Blog

言語処理学会 第25回年次大会(NLP2019)にブース出展しました

コーポレートコミュニケーション部

2019年3月12日から15日までの4日間、名古屋で開催された「言語処理学会 第25回年次大会(NLP2019)」(主催:一般社団法人 言語処理学会)にFRONTEOはプラチナスポンサーとして協賛し、会場内にてブース出展を行いました。

言語処理学会の年次大会は、自然言語に関する理論から応用まで幅広い研究発表を行う機 会として毎年開催されています。昨今は人工知能の分野で言語解析の技術や取り組みに注目が集まっているためか、例年にも増して、多くの参加者が見られました。

会場となった名古屋大学 東山キャンパス

FRONTEOのブースでは、数多くの企業に様々なケースで実践的に使われていることを紹介し、KIBITの特徴である「少ない学習データで、軽く、高い精度を出せる」ことに関心を持っていただきました。

FRONTEOブースの様子

今回の年次大会は、ポスターセッションにおいても、翻訳や対話、意味理解、文の自動生成、抽出、要約といった基礎研究に加え、感情や症状の把握、フェイクニュースの発見、褒め言葉の活用など、技術の活用方法やすぐ役に立つことを意識した発表が多く見られたことが印象的でした。学会に参加したFRONTEOの研究員が、気になった研究や注目点は以下のとおりです。

大会全体について

研究論文内で用いたプログラムをオープンソースで公開する文化が広まっており、結果として研究の裾野が大きく広がっていると感じました。英語圏の研究成果を日本語にローカライズしたり、各研究室の得意なドメインに適用・チューニングした研究も数多く見られました。

研究発表について

「P7-9マルチタスク学習による一貫性のある求人記事分類及び 職種フレーズと記事見出し文の生成」
求人情報のテキスト入力から、同じモデルで職種の分類、職種フレーズの生成、キャッチコピーの生成という3種類のタスクを学習し、各出力の一貫性を高めています。複数出力間の一貫性向上は重要な概念であり、例えば「推薦+推薦理由の生成」のマルチタスク学習など、人工知能の説明性担保とも関わってきます。商用Deep Learningにおいて、精度面以外からマルチタスク学習が検討される場面が増えてくると思われます。

「D1-4自動構築した日本語格フレームと英語FrameNetの対応付け」
「F2-3短単位品詞の用法曖昧性解決と依存関係ラベリングの同時学習」
英語圏の言語資源と日本語の言語資源を上手く結び付け、日本語の機械学習用データの整備を進めようとしています。最新モデルの利用が簡単になり、データの重要性が増していく中、日本語コーパスの質的・量的な充実に繋がる基礎研究にも注目していきたいと思います。

「E5-1 ExpertとImitatorの混合ネットワークによる大規模半教師あり学習」
最近、自然言語に対して深層学習が利用されるケースが増加傾向にありますが、自然言語のラベル付きデータは大量に用意できないことが多いです。そこで、半教師あり学習と呼ばれる手法が注目されています。半教師あり学習は少量のラベル付きデータから、まだラベルの付いてないデータに対して確信度が高いものに自動でタグを付けて学習する手法です。この研究では、今まで着目されなかったラベルなしデータに着目し、ラベルなしデータの量を増やすことで機械学習器の汎化性能の向上を目指していました。このままラベルなしデータによって機械学習器の汎化性能が向上するのであれば、今後テキストなどのラベル付きデータを用意することが困難な分野でも機械学習が適用しやすくなります。FRONTEOのKIBITは、すでに少量のトレーニングデータで学習を効率よく行っていますが、こういった技術を組み込むことで、今よりも活躍する場が格段に広がると感じました。

ポスターセッションが行われた会場前の看板

FRONTEOのブースでは、学会に参加される研究者や学生、企業の方々と気になる技術や取り組みについて情報交換を行いました、また、自然言語処理技術の重要性が世の中に広まるための意見もやり取りし、交流を深めました。さらに研究分野の掘り下げは勿論ですが、インターンや就活といった言葉も季節柄よく聞こえてきて、実際に企業が持つデータを使った研究や実装のチャンスへの関心が高いことが伺えました。FRONTEOでは、引き続き、同学会を支援し、自然言語処理のさらなる進展と社会での活用を目指して活動を行っていきます。

ロボットのKibiroも参加者の目を引いていました

ブースに来てくださった皆様、ありがとうございました。