生成 AI を利用した LT 資料作成ドキュメンタリー
目次
はじめに#
イベントで LT を行った。その資料がこちら。
急いでスライド資料を作成する必要があった。手動で作成すると、テーマの具体化からページ構成の作成、スライドの作成までに多くの時間がかかる。しかし、生成 AI を使ってみたら意外と速く作れた。そのやり方を書いておく価値はありそうだから、ここに記録しておこうと思う。本ブログでは、手動での作業手順と生成 AI を活用した作業手順を比較し、それぞれの時間配分と効率化のポイントを解説する。
スライド資料作成の全体像をイメージする#
LT 用のスライドを作るとき、まず最初に取り組むべきことはテーマの決定である。どんな内容を話したいかという方向性を固めるところからスタートする。たとえば、「AI エージェントについて話したい」というぼんやりとしたテーマを持っていたとする。この“ぼんやり”がスタート地点である。
手動でのスライド作成手順#
まずは手動でスライドを作成する場合の手順を見ていく。
1. テーマの具体化#
最初は連想ゲームのように、話したい内容を広げたり絞ったりする。 例えば、「AI エージェントってどんな課題を解決できるのか?」や「AI エージェントを活用する事例は?」といった具体的な疑問を文章に起こす。この段階では、まだスライドの形にはなっていないが、自分の考えを書き出すことが重要である。
2. ストーリーの構築#
次に、それらの内容を整理してストーリーを作る。話の流れが自然になるように構造化し、各ポイントがどのように繋がるかを考える。この時点で、自分が述べたいことが本当に正しいのか、追加の調査も必要になる。
3. ページ構成を考える#
ここでようやくスライドの具体的なページ構成を考える。「このページでは何を伝えたいか?」を端的に定義しながら、大まかな内容を決めていく。スライドそのものを書くのはこの後である。
4. スライドを書く#
最初はスライドを素早く書き起こす。この段階では、デザインや図形の細部にはこだわらない。一通り全てのスライドを作り終えたら、最終的に細かな修正を加える。
時間配分のリアリティ#
手動の場合#
手動でスライドを作成する場合、以下の時間がかかる。
- テーマの具体化からページ構成の作成まで:2〜3 時間
- 実際にスライドを作成する作業:さらに約 2 時間
合計で約 4〜5 時間を要することになる。短時間での作成が求められる場面では、この時間は非常に大きな負担となる。
生成 AI の場合#
生成 AI を活用する場合、以下の時間に短縮可能である。
- テーマの具体化からページ構成の作成まで:30 分(生成 AI により一度に完了)
- 実際にスライドを作成する作業:
- Gamma の生成結果に満足できた場合:30 分
- 修正が必要な場合:最大で約 2 時間
この結果、生成 AI を活用することで、最短で約 1 時間、修正が必要でも約 2.5 時間でスライドを完成させることができる。超時短。
生成 AI を活用したスライド作成手順#
1. 文字起こしを活用する#
まず、Mac のマイクを利用して自分が思いつく限りの内容を喋り、それを自動的に文字起こしする。この段階では順序や正確性は気にせず、自由に思いついたことを話すだけでよい。文字起こしが多少不正確でも問題ない。あとで LLM に食わせるのだけど、こうした雑なものでもうまく読み取ってくれる。
例えば文字起こししたものは以下のようなかんじ。見て分かる通り、文字起こしの精度は最悪。でもこれでよい。
2. 生成 AI で構造化する#
生成 AI(例: Claude)を利用して、文字起こしした内容を整理・構造化する。AI にシナリオ作成を依頼し、LT 用の流れを構築する。このプロセスは 1 ~ 3 の手順を一度にカバーし、実際にこれらを 30 分で終えることができた。
ここからはいわゆる アジャイル なプロセスである。私も完成した状態をあらかじめ完璧に想像できていない。しかしながら、 出てきたアウトプットに対してどのように違うか という 差分 の指摘はできる。
アウトプットを見る → 差分を指摘する → 修正する → アウトプットを見る → 差分を指摘する → 修正する → … というプロセスを繰り返すことを、これをアジャイルなプロセスと呼んでいるのだけど、今から AI とやるのはまさにこれ。
はじまりは以下。
この段階で出てきた Claude のアウトプットは以下。
インプットを分析させていただきました。AI Agent に関する最近のトレンドと、その背景にある本質的な流れについて、以下のような構成でスライドを作ることを提案します:
タイトルスライド
- 「AI Agent 最前線 - なぜ今 AI Agent なのか」
- サブタイトル: 「LLM アーキテクチャの進化と自律性の獲得」
AI Agent とは何か
- シンプルな定義
- 重要な特徴:自律性と環境との相互作用
- 「複数の LLM を複雑に組み合わせる」という現代的な特徴
トレンドの例示
- 各社の取り組み (AWS, 富士通, NTT データなど)
- 具体的なプロダクト例 (Perplexity, GenSpark, FeloAI)
なぜ今 AI Agent なのか(その 1)
- LLM への要求の複雑化
- プロンプトの肥大化問題
- 複数の小さなタスクへの分解という解決策
なぜ今 AI Agent なのか(その 2)
- LLM の制約(現在時刻、外部情報など)
- 「道具を使う」という解決策
- RAG も「検索という道具を使った LLM」という視点
実装アプローチ
- ReAct パターン
- Agentic Workflow
- ツール選択の自律性
先進的な事例:sakana.ai の AI Scientist
- 科学的営みの自動化
- 複数回の LLM 呼び出しによる推論の深化
将来展望
- AGI への一つのアプローチとしての可能性
- OpenAI o1 の自己レビューによる性能向上
まとめ
- AI Agent の本質:タスクの分解と道具の利用
- より賢く、より自律的な AI への進化
参考文献・リソース
このような構成で、現在の AI Agent ブームの背景にある本質的な流れと、その重要性を説明できると考えます。特に、単なるトレンド紹介ではなく、なぜこのようなアプローチが必要になってきたのかという文脈を重視しています。
この骨子でよろしければ、具体的なスライドのデザインと内容の詳細に進みたいと思いますが、いかがでしょうか?
ここに続けて、以下のような文句を複数回つけて、 AI とのラリーを続ける。
タイトルは なぜ今 AI Agent なのか、で。 自分で Agent を実装するとして、 Agent Design Pattern Catalogue という論文と LangGraph の存在、また microsoft の AutoGen にも言及してほしい。
AI Agent の定義は僕のメモだと不十分だと思うので、あなたで適切なものを補足して。Agent の実装パターンは ReAct → Agentic Workflow l Agent Design Pattern Catalogue という順番で。
最後の自己レビュー機能の重要性 OpenAI o1 の例は削除。 まとめは AGI への可能性としてまとめたい。
この段階で、AI が生成したシナリオは以下のようなかんじ。
はい、承知しました。特にまとめを AGI の文脈で再構成し、以下のように修正させていただきます:
タイトルスライド
- 「なぜ今 AI Agent なのか」
- サブタイトル: 「LLM アプリケーションの次なる進化」
AI Agent とは何か
- 定義:
- 環境を観察・認識し(Observe/Perceive)
- 判断・意思決定を行い(Think/Decide)
- 行動を実行する(Act/Execute) という自律的なサイクルを持つ AI
- 特徴:
- 目標設定に基づく自律的な行動
- 環境との継続的な相互作用
- フィードバックに基づく学習・適応
- 現代的な特徴:複数の LLM を組み合わせた複雑なアーキテクチャ
トレンドの例示
- 各社の参入(AWS, 富士通, NTT データ)
- 注目プロダクト(Perplexity, GenSpark, FeloAI)
- GitHub: awesome-ai-agents の紹介
なぜ Agent が必要か(その 1)
- LLM タスクの複雑化
- 単一の巨大プロンプトの限界
- 複数の小タスクへの分解という解決策
なぜ Agent が必要か(その 2)
- LLM の制約(現在時刻、外部情報など)
- Tool Use の重要性
- RAG も「検索という道具を使う Agent」という視点
Agent 実装パターンの進化
- ReAct: 初期の思考・行動フレームワーク
- Thought, Action, Observation のサイクル
- 基本的な思考プロセスの定式化
Agent 実装パターンの発展
- Agentic Workflow の登場
- より構造化されたアプローチ
- ツール使用の体系化
- 複数エージェントの協調
最新の Agent 設計論
- Agent Design Pattern Catalogue
- パターンの体系化
- 実装のベストプラクティス
- 実装フレームワーク
- LangChain の LangGraph
- Microsoft の AutoGen
- フレームワークの特徴比較
先進事例:sakana.ai の AI Scientist
- 科学的営みの自動化の挑戦
- 複数回の LLM 呼び出しによる推論の深化
- 2040 年への展望:ML/DL 分野での自律的な科学研究
まとめ:AGI への架け橋として
- 自律性の獲得:環境認識 → 思考 → 行動のサイクル
- 知識の組み合わせ:複数 LLM の協調と統合
- ツールの使用:実世界との相互作用
- 次なるステップ:より高度な自律性と推論能力へ
この構成で、特に最後の部分で AI Agent が AGI への重要なステップとなり得る可能性を示唆する形にまとめてみました。いかがでしょうか?
3. ページ割を行う#
AI が生成した内容を基に、スライドのページ割を考える。5 分間の LT では 10 ページ程度が目安だが、AI の提案でページの調整も可能になる。
以下のような指示をする。
OK。ではスライドの中身に言及したい。 まず、スライド 1 ページずつに
- スライドの表現としてどんなもの必要か
- 何をそのスライドで話をしたいか ということを整理して
以下のような出力が得られる。
はい、各スライドの具体的な表現方法と伝えたいメッセージを整理します:
- タイトルスライド
- 表現:
- シンプルで大きなタイトル「なぜ今 AI Agent なのか」
- サブタイトル「LLM アプリケーションの次なる進化」
- 右下に発表者情報
- メッセージ:
- AI Agent が単なるトレンドではなく、LLM アプリケーションの必然的な進化であることを予感させる
- AI Agent とは何か
- 表現:
- 3 ステップの循環図(Observe→Think→Act→Observe…)
- 各ステップの説明を簡潔な箇条書きで
- 現代的な特徴を強調するボックス
- メッセージ:
- AI Agent の本質は「自律的な判断と行動のサイクル」であること
- 現代の実装では複数 LLM の連携が特徴的であること
- トレンドの例示
- 表現:
- 企業ロゴと製品スクリーンショットのグリッド表示
- GitHub awesome-ai-agents のスター数推移グラフ
- メッセージ:
- AI Agent は理論だけでなく、実際のプロダクトとして急速に広がっていること
- 大手企業からスタートアップまで幅広い参入があること
- なぜ Agent が必要か(その 1)
- 表現:
- 左:巨大な単一プロンプトの図
- 右:複数の小タスクに分解された図
- 矢印で問題点と解決策を示す
- メッセージ:
- 複雑なタスクを単一のプロンプトで解決しようとする限界
- タスクの分解による解決アプローチの有効性
- なぜ Agent が必要か(その 2)
- 表現:
- LLM を中心に置き、周囲に必要な「道具」をアイコンで配置
- RAG を「検索という道具を使う Agent」として視覚化
- メッセージ:
- LLM 単体の限界と、それを超えるための「道具の使用」という考え方
- すでに普及している RAG も Agent の一形態として捉え直せること
- Agent 実装パターンの進化: ReAct
- 表現:
- ReAct の Thought→Action→Observation サイクルの図
- 実際のプロンプト例(簡略化したもの)
- メッセージ:
- 最初の体系的な Agent 実装パターン
- 思考プロセスを明示的に扱う重要性
- Agent 実装パターンの発展: Agentic Workflow
- 表現:
- Workflow の図示(複数の Agent の協調を含む)
- Tool Use の例示
- メッセージ:
- より構造化されたアプローチへの発展
- 複数 Agent の協調という新しい視点
- 最新の Agent 設計論
- 表現:
- Agent Design Pattern Catalogue の主要パターンをグリッド表示
- 各フレームワーク(LangGraph, AutoGen)のロゴと特徴比較表
- メッセージ:
- パターンの体系化が進んでいること
- 実装のための具体的な選択肢が揃ってきていること
- 先進事例:sakana.ai の AI Scientist
- 表現:
- sakana.ai の AI Scientist のアーキテクチャ図
- 複数回の LLM 呼び出しの流れを示す図
- メッセージ:
- 実際の複雑なタスクへの応用例
- 2040 年に向けた野心的な展望
- まとめ:AGI への架け橋として
- 表現:
- 階段状の図で現在の Agent から AGI への道筋を表現
- 各ステップ(自律性、知識統合、ツール使用)を視覚化
- メッセージ:
- AI Agent は AGI への重要なステップである可能性
- 現在の取り組みの歴史的な意義
これらのスライドを通じて、AI Agent の必要性、実装方法、そして将来性を体系的に説明できると考えています。
4. スライド生成 AI を活用する#
スライド生成 AI(例: Gamma)を利用すれば、もうスライドができあがる。
しかしながら、色々と Gamma で試行錯誤したけれども、結局満足いくものができなかった。フォントがダサいとか、編集がしにくいとか、細かいところでひっかかる。
結局その Gamma の出力を 参考にして 自分でスライドを作った。もともとスライド作りのセンスはないから、自分で一から作るよりはましかな、くらいのかんじ。
ちなみに、満足がいかなかった Gamma の出力は以下のようなかんじ。今見ると、そんなに悪くないのかもしれん。
まとめ#
手動でのスライド作成は時間と労力がかかるが、生成 AI を活用することでテーマ決定からスライド完成までのプロセスを劇的に効率化し、必要な時間を半分以下に短縮することができる。
個人的には、この Chat AI がもたらしたアジャイル的プロセスは、まさに革命的であると思う。生成されたアウトプットに対してフィードバックを高速に繰り返し、スライドの完成度をすごい速度で高めることができる。いいね。
おわり