KUDH Basics: デジタル・ヒューマニティーズ 「近現代日本文学作品の言語学的分析アプローチ」・ワークショップ 開催報告

文化遺産学・人文知連携センター KUDH Basics: デジタル・ヒューマニティーズ 「近現代日本文学作品の言語学的分析アプローチ」・ワークショップ 開催報告

2024年9月22日(日)に、人文知連携拠点の主催により、デジタル・ヒューマニティーズ「近現代日本文学作品の言語学的分析アプローチ」ワークショップを開催しました。人文知連携拠点では、人文学・社会科学分野の連携のきっかけのひとつとして分野横断的にデジタル的手法を学ぶ機会を提供してきました。その取り組みの一つとして、初学者でもデジタルツールを実践できるようになることを目的に、「Kyoto University Digitization Hub of the Humanities, Social and Cognitive Sciences (KUDH) Basics」と題したワークショップシリーズを2021年より始動しました。

4年目となる今年度は、デジタル・ヒューマニティーズ的手法による文学作品の遠読とテキスト情報の可視化に関するワークショップを、オンサイトとオンラインのハイブリッド形式で開催する運びとなりました。今回のワークショップでは、大阪大学大学院人文学研究科から黄晨雯助教と田畑智司教授をお招きして、演習を交えた解説を通じてレクチャーを行いました。授業動画は人文知連携拠点のWebサイト(https://www.ceschi.bun.kyoto-u.ac.jp/kyoten/)に公開されています。ワークショップは午前(9:00-12:00)・午後(13:30-16:30)の2部に分かれて行われ、午前の部は黄晨雯助教、午後の部は田畑智司教授が担当しました。

午前の部では、「トランスフォーマーを用いた言語処理の基礎」について学びました。具体的には、トランスフォーマー(Transformer)の紹介と基本的な使い方を解説した後、参加者は各自のパソコンでGoogle Colaboratoryを使用し、事前学習済みモデルを用いたテキストや映画レビューの感情分析、ニュース記事の分類を行いました。また、日本最大級のWeb小説投稿サイト『小説家になろう』の小説メタデータを活用してモデルのファインチューニングを実施し、単語間の関係性やテキストの類似度を2次元および3次元で可視化する演習を行いました。これらを通じて、参加者はトランスフォーマーの応用方法を深く理解し、実践的なスキルを習得しました。

ワークショップの様子(黄晨雯 氏、於 文学部校舎情報端末室)

午後の部では、「多変量文体分析モデルによる近代日本文学の遠」をテーマに、実演形式で解説と演習を行いました。まず、コーパス準備の一環として、青空文庫からのテキストダウンロード、下処理、およびMeCabのipadic-neologd辞書を使用した日本語の形態素解析の方法について解説しました。その後、近代日本文学作品64点からなるコーパスを用いて多変量文体分析モデルを実施し、作家や作品間に見られるタイポロジーや系譜を俯瞰的に捉える遠読を行いました。具体的には、Rのstyloパッケージを用いてtrigramsの分析とクラスター分析を行い、作品間の関係性を可視化しました。また、データ可視化アプリケーションGephiを使ってConsensus network図の作成を行い、LDAトピックモデリングの技法についても解説しました。最後に、Macユーザー向けに、CasualConcを用いた直感的な分析方法も紹介されました。このレクチャーを通じて、参加者はテキスト間の関係性を可視化するアプローチと遠読のテクニックを習得することができました。

ワークショップの様子(田畑智司 氏、於 文学部校舎情報端末室)

午前3時間、午後3時間、計6時間に及ぶワークショップには、オンサイト・オンライン合わせて、学内外から学部生や大学院生、大学教員、研究員、社会人など、約45名が参加しました。参加者の多くは言語学や人文学を専攻する文系の学生で、学外からの受講者が大多数を占めており、会社員の方からも複数の応募があったことが印象的でした。また、応募者の約半数はPythonの使用経験があった一方で、約4割は完全なプログラミング初心者でした。申込時のアンケートから、Pythonによるテキスト情報の可視化、言語学的分析のアプローチ、およびデジタルヒューマニティーズ的手法による文体分析を基礎から網羅的に学びたいという需要が大きいことがわかりました。受講後アンケートによれば、内容の充実度や理解度は全体的に高評価だった一方で、文体分析や言語学的分析に役立つデジタルヒューマニティーズのワークショップを定期的に開催してほしいという声もありました。こうした意見を受けて、言語学的分析のアプローチやデジタルヒューマニティーズの手法を集中的に学ぶワークショップの開催を現在検討しています。

今回のワークショップが、参加者にとって、研究活動における人文学研究の方法論や文体分析のアプローチの一助になれば幸いです。人文知連携拠点では、今後もデジタルツールを用いた研究手法・データ管理について入門的なワークショップを開催していきたいと考えています。なお、本ワークショップは若手重点戦略に関連する活動です。