本物の会話が、 本物のAI を作る

必要なのは、ノイズも感情も含んだリアルな会話データ。 私たちは、人々の自然な会話から、本当に使える音声データを提供します。

なぜ、綺麗すぎるデータでは通用しないのか

合成音声やスタジオ収録のような、理想的な環境で作られたデータで学習したAIは、現実世界の雑音や予測できない状況に対応できません。
鍵は、学習データの「リアルさ」にあります。

提供データタイプ

目的に合わせて、3つの形式でデータを収集・提供可能です。

フリートーク(2人)

2人のユーザーが自由に会話したデータ。相槌、笑い、会話の重なり、言い直しなど、自然なやり取りがそのまま記録されています。対話型AIや感情分析に向いています。

テーマトーク(1〜2人)

「最近楽しかったこと」といったテーマについて、ユーザーが自由に話したデータ。特定のトピックに関する言葉や表現を集めるのに使えます。

シナリオ・タスク(1人)

「AIに天気を聞く」「ロボットに指示を出す」など、具体的なシーンを想定した会話データ。実際の利用場面を再現できます。

活用事例

様々なAIプロダクトの開発・学習にご活用いただけます。

会話AI

会話AI / 音声アシスタント

イントネーション、ためらい、感情表現を含む自然な対話データを学習。言葉だけでなく「どう言われたか(社会的ニュアンス)」を理解するAIの構築に。

コールセンターAI

コールセンターAI

ユーザーの割り込み、言い直し、同時発話など、現場で頻発する「ロングテール」なエッジケースを網羅し、モデルの堅牢性を高めます。

モビリティ

モビリティ / ロボティクス

環境ノイズが混じる実環境下での音声指示認識。機械が現実世界の音響空間で安全かつ適応的に動作するための「耳」を育てます。

サンプルデータ請求・お問い合わせ

お問い合わせフォームより、実際のデータセットのサンプルを配布しております。 データの形式やファイル構成など、まずはお気軽にご確認ください。