2025年7月27日〜8月1日に開催された自然言語処理のトップカンファレンス The 63rd Annual Meeting of the Association for Computational Linguistics (ACL2025) において当研究室からD3 斉がポスター発表を行いました. (執筆者:斉)
ACL 2025は,オーストリアの首都ウィーンのAustria Center Viennaで開催され,過去最大規模の自然言語処理国際会議となりました.世界各国から研究者や技術者が集まり,最新の研究成果や技術動向について活発な議論が行われました.
メインカンファレンスでは1,699件の本会議論文,1,392件のFindings論文,108件のIndustry Track論文が発表され,17件のCL論文と40件のTACL論文も採択されました.また,2件の基調講演,1件のパネルディスカッションなど,多彩な企画が実施されました.さらに,28件以上のワークショップ(800本超の論文),8件のチュートリアル,64件のデモ,104件のSRW論文が発表されました.採択内訳は,Main Conferenceが1,699件(20.3%),Findingsが1,392件(16.7%)で,いずれも過去最多となりました.
ACL 2025に採択された論文の著者は約2万人にのぼり,中国が51.0%と最多で,次いでアメリカ(18.6%),韓国(3.4%),イギリス(2.9%),ドイツ(2.6%)などが続きました.日本は全体の1.6%を占め,8番目に多い国でした.
論文は幅広いトピックに分布しており,最多はNLP Applications(13.1%),次いでResources and Evaluation(12.4%),Multimodality and Language Grounding(7.3%)などが続きました.全体として多様な研究領域がカバーされていました.
また,全論文の67%に「LLM」がタイトルまたはアブストラクトに含まれており,内訳は「GPT」が9%,「LLaMA」が8%,「DeepSeek」「BERT」「Gemini」などが2%でした.全体の65%の論文はタイトルにコロン(:)が含まれていました.
斉はポスターセッションにて,日本語のオンライン心理カウンセリング対話データセットKokoroChatと,それを用いた対話生成モデルの研究について発表を行いました.
KokoroChatは,訓練を受けたカウンセラー同士によるロールプレイを通じて収集された,6,589件の高品質なカウンセリング対話から構成されており,各対話にはクライアント視点の詳細なフィードバックが付随しています.発表では,このデータセットの収集プロセスに加え,KokoroChatを用いてファインチューニングしたモデルの生成性能の評価結果についても紹介しました.
会場では多くの方が足を止めてくださり,実際にカウンセリングに携わる方々からも有益なご意見をいただくことができました.海外の参加者との議論も活発で,非常に充実した発表となりました.
Zhiyang Qi, Takumasa Kaneko, Keiko Takamizo, Mariko Ukiyo, Michimasa Inaba: KokoroChat: A Japanese Psychological Counseling Dialogue Dataset Collected via Role-Playing by Trained Counselors, In Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pp. 12424–12443, 2025.
Huachuan Qiu and Zhenzhong Lan. PsyDial: A Large-scale Long-term Conversational Dataset for Mental Health Support. In Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pages 21624–21655, 2025.
この研究では,長期的なクライアント・カウンセラー対話を再構築するために,プライバシーに配慮したデータ再構成手法「RMRR(Retrieve, Mask, Reconstruct, Refine)」を提案し,PsyDialという大規模なメンタルヘルス支援対話データセットを構築しています.平均37.8ターンと長めの対話が特徴で,評価のためにカウンセリング書籍から抽出した101対話も併用しています.本データでファインチューニングされたモデルは,心理カウンセリング性能においてベースラインを上回り,専門家の評価でも高品質な応答が確認されました.
Yiting Ran, Xintao Wang, Tian Qiu, Jiaqing Liang, Yanghua Xiao, and Deqing Yang. BOOKWORLD: From Novels to Interactive Agent Societies for Story Creation. In Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pages 15898–15912, 2025.
この研究では,小説の世界観や登場人物をもとに,マルチエージェント社会を構築・シミュレートするBookWorldを提案しています.登場人物の性格や関係性,地理・文化的背景を保ちながら,創造的で一貫性のある対話・物語生成を可能にします.ストーリー生成だけでなく,対話型ゲームや社会シミュレーションにも応用可能で,実験では75.36%の勝率で従来手法を上回る性能が確認されました.
会場には非常に多くの参加者が集まり,特にポスターセッションでは,1つのセッションで最大400件ものポスターが同時に発表されるほどの規模で圧倒されました.すべてを見て回るのは難しく,どのポスターを見るかの選択も一苦労でした.
また,Social Eventでは大勢の参加者が集まり,音楽に合わせてみんなで踊ったり盛り上がったりと,非常ににぎやかな雰囲気で,国際会議ならではのエネルギーを感じました.
多くの研究者との交流や,世界中の最先端の研究発表に触れることで,大きな刺激を受け,今後の研究へのモチベーションがさらに高まりました.