ポッドキャスト番組スタイルの謎に迫る

近年、市場ではもちろん、学術界でも「ポッドキャスト」の注目が増しています (図1)。そんなポッドキャストには、大きく分けて1人の話し手が語り続ける「モノローグ (一人語り)」と、複数の人が会話をする「ダイアローグ (対話)」という2つスタイルがあります。最近では、特に対話形式のポッドキャストが人気を集めており、イギリスでは2023年の人気ニュースポッドキャスト10番組のうち9つが対話形式だったほどです。日本でも、これまでのJAPAN PODCAST AWARDSの大賞の多くを2人組のチャンネルが受賞しています。さらに、Googleが出しているNotebookLMというAIプラットフォームの新機能では、アップロードした資料を自動的に、2人の会話形式 (一人語りではなく) に変換してくれます。

図1. 2000年~2024年の「ポッドキャスト」関連論文の出版数の推移 (Hitsuwari et al.、 2025より抜粋)

図1. 2000年~2024年の「ポッドキャスト」関連論文の出版数の推移 (Hitsuwari et al.、 2025より抜粋)

これほどまでに対話形式が注目される理由は何でしょうか?そして実際に、対話形式は一人語りよりも優れているのでしょうか?この疑問に答えるため、私たちは、日本人296名を対象とした実験を行いました (Hitsuwari et al.、 2025)。AIが作成した同じ内容のポッドキャストを、一人語り形式と対話形式の2つのバージョンで制作し、それぞれの聴取体験を詳しく比較したのです。

AIが作ったポッドキャストで実験してみた

今回の研究では、非常にユニークな手法を用いました。私たちは、「AIとの共創で生まれた俳句の美しさに迫る」というタイトルの学術記事 (櫃割他、 2023)を紹介するポッドキャスト番組の台本をChatGPT 4oを使って作成しました (図2)。この台本をもとに、2つのバージョンの番組を制作しました。一人語り版では、心理学の専門家が1人で内容を説明し続ける台本、対話版では、一般の司会者が専門家にインタビューする台本を作りましたが、内容や長さ (約5分)はほぼ同じです。台本をVoiceVox というAI音声ツールに読み上げさせることで、AIポッドキャスト番組が完成します。

図2. ChatGPT作の台本の一部

 

参加者は無作為に2つのグループに分けられ、1つのグループは一人語り版を、もう1つのグループは対話版を聴きました。その後、楽しさ、好感度、興味、理解しやすさ、没入感、信頼性など8つの項目について7段階で評価してもらいました。さらに、番組内容の理解度を測る3つのクイズにも答えてもらい、答えに対する自信の程度も調べました。

形式によって差はないという意外な結果

研究結果は、私たちの予想に反するものでした。楽しさ、好感度、興味、理解しやすさなど、すべての評価項目において、一人語りと対話の間に統計的に有意な差は見られませんでした。形式による影響はほとんどないことが示されました。

内容理解に関しても、全体的なクイズの正答率に差はありませんでしたが、興味深いことに、「最も美しいと評価された俳句はどれか」というクイズについては、一人語り版の方が正答率がやや高く (86.18% vs 70.83%)、答えに対する自信も高いという結果が得られました。これは、一人語りの方が重要な情報を一貫して強調できるためかもしれません。

一方で、参加者の性格特性との関係を調べたところ、ポッドキャストの形式と性格が組み合わさったことで特別な影響が出る、ということはありませんでしたが、協調性の高い人ほど番組を高く評価し、複雑さや新奇性を求める傾向の強い人ほど楽しみ、また聴きたいと思う傾向があることがわかりました。

なぜ対話形式の優位性が見られなかったのか?

これまでの会話に関する研究では、対話形式の方が理解しやすく、魅力的だとされる結果が多く見られました。しかし、今回の実験では、そうした効果が見られませんでした。私たちは、その理由をいくつか考察しています。

まず、従来の研究では、対話形式の利点は情報量の違いではなく、「多様な視点」にあるとされてきました (Tolins et al.、 2018)。つまり、複数の人が異なる角度から物事を説明することで理解が深まるということです (例えば、研究者と一般の人、心理学者と物理学者、など)。しかし今回の実験では、同じAIが作成した内容を一人語りと対話の両方の形式で提示したため、実質的に同じ情報と視点が伝えられました。これが形式間の差を生まなかった主な原因と考えられます。また、今回使用された対話は、事前に用意された台本に基づくものでした。自然な会話では、話し手と聞き手がお互いの理解を調整しながら共通の視点を形成していくプロセスがありますが、台本化された会話では、このような自然な相互作用が制限されていた可能性があります。さらに、実験で使用されたポッドキャストの長さが約5分と短かったことも影響している可能性があります。より長い内容であれば、対話形式の利点がより明確に現れるかもしれません。

まとめと今後の展望

この研究は、ポッドキャストの制作者や聴取者にとって重要な示唆を与えています。形式 (一人語りか対話か)よりも、聞き手の性格特性の方が、聴取体験に大きな影響を与える可能性があることが明らかになりました。特に教育的な内容については、一人語りでも十分に効果があり、特定の情報を伝える際にはむしろ有利な場合もあることが示唆されました。これは、ポッドキャスト制作者にとって、必ずしも複数人での番組制作にこだわる必要がないことを意味します。

ただし、この研究にはいくつかの限界もあります。AIが生成した台本と音声を使用したため、人間同士の自然な会話の特徴を完全には再現できていない可能性があります。また、重ねてになりますが、5分という短い番組では、形式の効果が十分に現れなかった可能性もあります。今後の研究では、より自然な対話を含む番組や、より長い時間の番組、そして多様なトピックを扱った番組での比較が期待されます。また、マルチタスク環境での聴取や、集中して聴く場合など、聴取環境の違いによる影響も興味深い研究テーマとなるでしょう。

この研究は、急速に成長するポッドキャスト市場において、制作者が番組形式を選択する際の重要な参考資料となると同時に、AI技術を活用したコンテンツ制作の可能性も示しています。形式にとらわれすぎず、内容の質とリスナーの特性に注目することが、より良い聴取体験を提供する鍵となるのかもしれません。

研究支援への謝意

本研究は、日本学術振興会海外研究員制度およびacademist Prize 4期 (クラウドファンディングプロジェクト「『美は世界を救う』を心理学で実証したい」)のご支援を受けて実施されました。また、クラウドファンディングプロジェクトに紐づく心理学研究コミュニティ「あいまいと」のメンバーから、研究全体を通じて貴重なコメントを数多く頂きました。この場を借りて、心より感謝申し上げます。引き続き、クラウドファンディングプロジェクトおよびコミュニティ運営を行って参りますので、ぜひこの機会にさらなるご支援を頂けますと幸いです。「あいまいと」で次の心理学研究をご一緒できることも楽しみにしております。

 

引用文献

この記事を書いた人

櫃割仁平, 林尚芳
櫃割仁平, 林尚芳
櫃割仁平
へルムートシュミット大学ポスドク研究員 (日本学術振興会海外特別研究員)。京都大学教育学研究科博士後期課程修了。博士 (教育学)。専門は感情心理学、実験美学。美や感動のメカニズムに興味を持ち、特に世界最短の詩、俳句を題材に心理調査・実験、脳機能計測などを行っている。現在は、日的な美的感性を検討・発信をするために、ドイツにて文化比較研究を行っている。日本学術振興会第14回育志賞受賞。2022年9月よりacademistにて月額制クラウドファンディングを実施。第2期、3期、4期academist Prize採択。ポッドキャストプラットフォームVoicyにて、毎日心理学の論文を紹介中。

林尚芳
科学技術情報を専門としたデータアナリスト。研究コミュニティあいまいとのメンバー。ポッドキャスト番組「IDEAFLOW」のMC(メタサイエンス・アントレプレナーたちの思考と活動を深堀りする番組)。今回のポッドキャスト研究では、AI生成ポッドキャストの制作とデータ分析を担当。
https://x.com/hayataka88