本物の会話が、 本物のAI を作る
私たちは、人々の自然な会話から、本当に使える音声データを提供します。
なぜ、綺麗すぎるデータでは通用しないのか
合成音声やスタジオ収録のような、理想的な環境で作られたデータで学習したAIは、現実世界の雑音や予測できない状況に対応できません。
鍵は、学習データの「リアルさ」にあります。
Kataro!! Natural Data(私たちのデータ)
日常の生の会話
- 生活音やノイズを含むリアルな環境
- 台本のない自然な会話と感情表現
- 言い淀みや会話の重なりも収録
私たちのデータは、ユーザーが日常的な会話ツールとしてプロダクトを使う中で、自然に収集されたものです。スタジオにはない生活音やノイズ、台本にはない言い淀みや感情の揺れ――こうした「日常そのまま」が詰まっています。AIはこれらを学習することで、実際の複雑な環境でも機能するようになります。
提供データタイプ
目的に合わせて、3つの形式でデータを収集・提供可能です。
フリートーク(2人)
2人のユーザーが自由に会話したデータ。相槌、笑い、会話の重なり、言い直しなど、自然なやり取りがそのまま記録されています。対話型AIや感情分析に向いています。
テーマトーク(1〜2人)
「最近楽しかったこと」といったテーマについて、ユーザーが自由に話したデータ。特定のトピックに関する言葉や表現を集めるのに使えます。
シナリオ・タスク(1人)
「AIに天気を聞く」「ロボットに指示を出す」など、具体的なシーンを想定した会話データ。実際の利用場面を再現できます。
活用事例
様々なAIプロダクトの開発・学習にご活用いただけます。