「Genspark」は2024年に登場した検索特化型の生成AIです。最新情報を扱えるので、とても便利だったのですが、「Perplexity」や「Felo」といったライバルがどんどん機能拡張を進め、最近「Genspark」が話題に上ることが少なくなってきました。そんな時に、とんでもないアップデートをするのが生成AI界隈です。「Genspark」もご多分に漏れず、2025年4月2日に「Gensparkスーパーエージェント」をリリースしました。→過去の「柳谷智宣のAIトレンドインサイト」の回はこちらを参照。
高性能な複数のLLMを活用した「Gensparkスーパーエージェント」
最近はAIエージェントと名の付くサービスが乱立しています。それは本当にAIエージェントと言えるのか?と思うサービスも多い中、OpenAIの「Operator」や中国のAIスタートアップButterfly Effectが開発した「Manus」など自立汎用型のAIエージェントも登場しています。
YouTubeのGensparkチャンネルにスーパーエージェントの解説動画が投稿されていたのですが、想像を超える内容でした。スーパーエージェントが日常のさまざまなタスクをどのように処理できるか、具体的なデモを通じて説明していたのです。
「4月中旬にサンディエゴへの5日間の旅行を計画してほしい」というリクエストをすると、スーパーエージェントが「トラベルツール」を使って旅行関連のデータセットにアクセス。公共交通機関に関する情報を得るため「ディープリサーチツール」を使い、地図ツールで各観光スポット間の距離を計算し、移動や徒歩距離を考慮したプランを作成しました。
その結果、公共交通機関を使いたい、徒歩距離を抑えたい、特定の飲食店の好みなどに応した詳細な旅程表を数分で提示してくれたのです。
旅行日程中のレストラン予約をAIが電話で行うデモも行われました。「Call for me」というツールを使い、AIが人間の声で実際にレストランへ電話をかけるのです。アレルギーや席のリクエストに関しても会話していた。
英語でしたが、とても自然です。「NVIDIA 5090チップを入手したいからAIに100件電話させる」というシナリオも提示されましたが、ちょっと日本ではマナー違反になるかもしれません。
そのほか、サウスパーク風のエピソードを生成したり、料理動画を生成するなど、驚くようなデモが行われました。「スーパーエージェント」は誰でも、どんな日常タスクにも使えることを目指しているとのことです。
Gensparkスーパーエージェントを使い込んでみる
そこで早速、有料契約し、使い込んでみました。まずは、Gensparkスーパーエージェントについての解説資料を作ってもらいましょう。プロンプトはシンプルに1行だけ。
-
プロンプト
Gensparkスーパーエージェントを徹底解説する資料を生成してください。
すぐにWeb検索が始まり、動画を発見。その内容を分析し、コンテンツが生成されていきます。右側の領域にスライドが表示され、思考や作成しているコードがリアルタイムで表示されていきます。もちろん、見せ方がうまいということもあるのですが、AIエージェントが自律的に動作しているのだな、と実感します。
少し待つと12枚のスライドが生成され、PDFファイルでダウンロードできます。テキストからプレゼン資料を作ることは既存の生成AIでもできますし、プレゼン資料専門の生成AIも登場しています。
これまでは一般的な生成AIが作るスライドは微妙だったのですが、Gensparkスーパーエージェントは一味違いました。
日本語資料でもバッチリとデザインされており、多段構成の上、スライド下に別要素を入れるなど凝っています。高性能な複数のLLM(大規模言語モデル)を使っているので、内容はもちろん問題なし。スライド専門サービスと同レベルもしくは上回るクオリティです。
ダウンロードはPDFだけで、PowerPointに変換するとフォントが変になったり、縦横比がスライドによって変わったりするのが気になります。ここはブラッシュアップを期待したいところです。
動画を作成
Gensparkスーパーエージェントは画像も動画も生成できます。とは言え、普通にテキストtoイメージではつまらないので、複数のエージェントを組み合わせて広告用のショート動画のようなものを作ってもらいましょう。
デモを参考にして、まずは日本の川下りの画像を検索し、それに似た画像を生成してもらい、川下りをしている動画を生成し、タイトルを入れてもらいましょう。
すぐに6枚の画像を検索し、動画の始まりと終わりになる画像を生成。そして、その2枚をつなぐような動画を生成し、文字が入りました。BGMも生成されダウンロードできるようになっています。
ただし、デモにあったように、BGM付の動画にはなりませんでした。また「rafting」と指示しましたが、「t」が抜けました。とは言え、これはトライ&エラーを繰り返したり、プロンプトを調整することで成功することもあると思います。
-
プロンプト
日本の川下りのアクティビティの写真を検索し、それを参考にして画像を生成してください。そして、その画像を元に川下りをしている動画を生成。動画の最初には「River rafting 2025」というテキストを表示してください。そして、楽しい感じのBGMを生成し、ショート動画にしてください。
新規参入する領域の調査を行い、ビジネスプランをプレゼン資料にしてもらいましょう。Gensparkスーパーエージェントと同時に「エージェント・ディープ・リサーチ」機能も登場したので、それぞれの出力を比較してみました。
まずディープリサーチでは、市場やトレンド、法的規制などを調査し、ビジネスモデルを提案してくれました。しかし、肝心のPowerPoint資料は、3行の箇条書きをスライド12枚分提示しただけでした。確かに、調査結果から自分でコピペすれば作れますが、これではAIエージェントの成果物とは言えません。
では、スーパーエージェントはどうでしょうか。おなじく12枚のスライドを生成してくれたのですが、ディープリサーチよりも詳細に分析しているうえ、スライドが詳細にまとめられています。競合分析も実在のショップをリサーチし、ブランド力や価格、高級感などをグラフ化していました。
実は筆者が立ち上げようとしているビジネスなのですが、差別化ポイントはほとんど実際に実行しようと考えていた内容です。タイムラインと必要資金のところは、5000万円となっているなど、なかなか規模が大きくなっていました。投資家向けの資料と指示したからかもしれません。
ちなみに、この資料を作成するのに約800クレジットかかりました。日本円にすると232円です。遊びで回しまくるなら高いですが、本当に必要なのであれば激安です。
-
プロンプト
ウイスキーを小瓶に詰め替えて販売するビジネスを始めます。競合を調査し、チェックすべきポイント、差別化するプランを教えてください。また、その結果を出資者向けのPowerPoint資料にしてください。
「通話代行」機能
Gensparkスーパーエージェントやエージェント・ディープ・リサーチと同時に「通話代行」という機能もお目見えしました。これは、その名の通り電話を掛ける機能です。初回は、自分の電話番号を登録し、送信されてくるコードを入力して認証します。
まずは、Gensparkから電話がかかってきて、AI音声に慣れるデモが行われます。単に音声を再生するだけでなく、話しかけると対応してくれました。ChatGPT 4oで体験済みですが、非常に滑らかに応答できるのが驚きです。
そのあとは、普通にプロンプトを入力することで、電話をかけるというタスクを含む処理を遂行してくれます。想定しているのは予約です。通話先は自由に電話番号を入力できるわけではなく、Googleマップの検索結果から検索します。電話番号を公開している飲食店や事務所などは普通に検索できます。
自分の代わりに電話して、予約したり購入してくれるのは確かに便利です。しかし、プロンプトに必要な情報を入れこまないと、適当なことを話すことがあります。予約人数や日時を指定せず「予約しておいて」と指示すれば、電話をかけてしまうのです。
これは、先方に大きな迷惑をかけることになります。通話代行には、必要な情報を逆質問してくる仕組みを組み込むべきでしょう。
気になる利用料金ですが、無料でも数回利用できます。しかし、すぐにクレジットが尽きてしまいますので、有料プランの契約が必要になるでしょう。
「Plus」プランは月額24.99ドルで、年払いにすると月額19.99ドル相当に割引されます。Plusプランは月に1万クレジットが付与され、最新のAIモデルや画像・動画生成AIを利用できます。1万クレジットを追加するクレジットパックも19.99ドルで購入できます。
結果として、GensparkスーパーエージェントはしっかりAIエージェントでした。電話をかけられるなど自由度が高くてトラブルも起こしそうですが、新しい未来に足を踏み入れていることは間違いありません。いきなり勢いを盛り返したGensparkをぜひ触ってみてください。