2022/8/4 12:14

要旨

1回目のワークショップでは、BERTを使った文書分類システムをとりあえず動かせるまでお話しました。その後、各自でプログラムを動かし、体験してていただけたものと思います。2回目のワークショップでは皆様の体験をお聞かせいただき質疑応答を行います。また、このプログラムを元に、システムの改善のアイデアをお話しします。1回目に参加したか、ビデオを見て、プログラムを動かして頂いていることが、今回の参加の前提となります。(詳しくはホームページにて:http://shinra-project.info/bert_workshop_shinra2022/)

自然言語処理技術に対する期待と需要が高まる中、質の高い研究開発を行える人材の育成が望まれています。2018年にBERTが登場して以降、XLNet、ALBERT、RoBERTaといったBERTをベースとしたモデルが次々と登場しており、今後の自然言語処理において必須といえる状況となっています。こうした状況を踏まえ、本ワークショップでは、BERTなどの技術に興味はあるが実際に触れたことがない学生や若手研究者をメインターゲットとして(もちろん上記以外の方も歓迎です!)、テキスト分類タスクを通して実際にBERTを体験する場を提供します。

本ワークショップは、8月4日(木)と8月10日(水)の2日開催を予定しており、初日にタスクデータの説明とBERTでの基本的な分類方法について説明を行い、2日目には実際に体験した結果に基づいて質疑や議論をしていきます。初日と2日目の間に一週間程度、ご自身で自由な時間に行う体験期間を設けており、この期間に体験していただくことで初日に参加できなかった方でも2日目からの参加が可能です。初日の説明は動画として公開し、体験期間中はSlackなどを通して随時サポートを行います。デフォルトとしてGoogle Colaboratoryを利用するため、特別な環境構築は不要です。また、体験教材としてWikipedia構造化プロジェクトである森羅2022(http://2022.shinra-project.info/ )のデータを用い、この森羅プロジェクトについても説明します。

本ワークショップを通して、最新の自然言語処理技術に対する理解を深めてもらいたいと考えています。また、学生や研究者間の意見交換の場としても活用して頂ければと思います。

<日時>
8月10日(水) 13:00-14:30

<参加方法>
形式:オンライン(Zoom)
※当日はミーティングを録画し、後日Web公開する予定です。

<プログラム(予定)>
2日目:8月10日(水) 13:00-14:30
13:00-13:05 再開の挨拶
13:05-14:00 体験報告・質疑応答
14:00-14:25 BERTの先へ――構造化された知識の活用
14:25-14:30 閉会の挨拶

<ホームページ>
http://shinra-project.info/bert_workshop_shinra2022/

森羅2022実行委員会
理研AIP 言語情報アクセス技術チーム

詳細情報

日時 2022/08/10(水) 13:00 - 15:00
URL https://c5dc59ed978213830355fc8978.doorkeeper.jp/events/141143