2023年3月22日(水)に、人文知連携拠点の主催により、統計分析ソフトウェア「R」を用いた統計解析手法を学ぶワークショップをオンラインで開催しました。人文知連携拠点では、人文学・社会科学分野の連携のきっかけのひとつとして分野横断的にデジタル的手法を学ぶ機会を提供してきました。その取り組みのひとつとして、初学者でもデジタルツールを実践できるようになることを目的に、「Kyoto University Digitization Hub of the Humanities, Social and Cognitive Sciences (KUDH) Basics」と題したワークショップシリーズを2021年より始動しました。2022年度は「人文・社会科学分野における統計解析の実践」をテーマに、まず初めに2022年9月22日から23日にかけて「統計ソフトウェア「R」ワークショップ」の第1回講座を開催し、Rソフトウェアのインストールから基本操作までを演習形式でレクチャーしました。
Rワークショップの第2回目となる今回は、Rを用いた統計解析の手法を、演習を交えて解説しました。第1回の受講者アンケートより、より高度な統計解析手法を学びたいという要望が多く寄せられ、本講座を開催する運びとなりました。授業動画は人文知連携拠点の Webサイトに公開されています(https://www.ceschi.bun.kyoto-u.ac.jp/kyoten/)。ワークショップは午前・午後の2部に分かれて行われました。午前の部は人文知連携拠点の藤本助教が担当し、午後の部では立命館大学総合心理学部の日本学術振興会特別研究員である山﨑大暉先生を講師に招き、授業を行いました。
午前の部では、まず前回ワークショップの復習として、Rとそのグラフィカル・インターフェースである「R Studio」の使い方を学びました。具体的には、プログラムの動作結果をドキュメント形式で保存できる「R Markdown」機能を各受講者のパソコンに導入しました。次に、効率的なデータ分析を支援する「Tidyverse」パッケージをR Studioに導入し、煩雑になりがちなデータの抽出や並べ替えを、数行のコードで自動化する方法を実演しました。データ処理のための基本的な環境を整えた後、R言語を用いた統計的仮説検定をレクチャーしました。統計的仮説検定では、2つのデータの平均値を比較するt検定と、3群以上の比較を行う分散分析を扱い、サンプルデータを例に演習を行いました。
午後の部では、データを数式に当てはめて近似する「統計モデリング」について学びました。まず、データを1つの直線で近似する「単回帰モデル」を例に、統計モデリングの基本的な考え方や用語を解説しました。次に、モデルに基づいて仮説検定を行う方法を、Rで実演しながら説明しました。授業では様々な種類のモデルが紹介されました。その中で、午前の部で学んだt検定や分散分析を、統計モデリングによって行う方法を学びました。また、従来の統計的仮説検定では扱うことができないデータであっても、統計モデリングを用いることで柔軟に分析できることを例示しました。統計モデリングを学ぶことで様々なデータを自由に分析できることを結論として、ワークショップを総括しました。
午前3時間、午後3時間、計6時間に及ぶワークショップには、学内外から学生、大学教員、社会人など、約 50 名が参加しました。前回のワークショップに比べ、学外からの受講者が大多数を占めており、会社員の方からも複数の応募があったことが印象的でした。事前アンケートによれば、受講者のうち約半数はRの使用経験があった一方で、2割は完全なプログラミング初心者でした。授業中はプログラミングのトラブルに関する質問が多く寄せられましたが、質問者のパソコン画面をZoomで共有しながら解決を図ることで、受講者全体で解決方法を共有しました。受講後アンケートによれば、内容の充実度は全体的に高評価だった一方で、理解度については授業の進行に伴い評価が低下する傾向が見られました。特に午後の授業に関して、内容が難しく理解が追い付かなかったというコメントが複数寄せられました。こうした意見を受けて、統計モデリングを集中的に学ぶワークショップを開催することを現在検討しています。
今回のワークショップが、参加者にとって、研究活動におけるデータ分析技術向上の一助になれば幸いです。人文知連携拠点では、今後もデジタルツールを用いた研究手法・データ管理について入門的なワークショップを開催していきたいと考えています。なお、本ワークショップは若手重点戦略に関連する活動です。