Google、デバイス上で動作しフィラーを排除する無料の AI ディクテーション アプリをリリース

グーグル は、ユーザーの選択に応じて、デバイス自体のローカルとクラウドの両方で実行できる新しい AI ディクテーション アプリケーションをリリースしました。 Google AI エッジ雄弁 モデルを使用する ジェマ 最初の場合、または ジェミニ 2番目に。このアプリは無料で、現在は以下でのみ利用可能です。 iOS、Google は App Store ページで、以下のために設計されていると説明しています。 「ギャップを埋める」 人々の実際の話し方と専門的な文章の間。このシステムは次のことが可能です 「えー」、「うーん」などのフィルターフィラーや文中の自動修正

このアプリケーションはオフライン操作を優先します。つまり、Gemma 自動音声認識モデルを携帯電話にダウンロードしますが、「クラウド」モードもあります。名前が示すように、このモードはデータをクラウド内の Gemini モデルに送信して、テキストのクリーニングを処理します。理論的には、 ローカル処理は高速で音声をプライベートに保ちますが、クラウド オプションでは複雑なフレーズをもう少し洗練された仕上がりにすることができます。

Gemma モデルは、Google の生成 AI モデルのファミリーです。 Geminiと同じ技術ベースで構築されていますですが、開発者や企業が独自に実行、微調整、展開できるように設計されています。 Googleはそれらを次のように説明しています パラメータをダウンロードして変更できるオープンモデル (IA の専門用語でオープンウェイトと呼ばれるもの) は、会社が定めた条件内で商用利用も可能です。

実際には、これは、要約、質問への回答、推論、テキストの生成、またはテキストの転記とクリーニングなどのタスクに使用され、両方をクラウドで実行できることを意味します。 バリアントに応じて、モバイル、ラップトップ、その他のデバイスを含むローカル コンピュータ上と同様

アプリケーションが提供する他の機能の中には、次のような可能性があります。 トランスクリプトを要点に要約するか、口調を変える より正式に、簡潔に、または広範囲にします。また、履歴を確認して、1 分あたりの単語数や以前のセッションの総単語数を確認することもできます。アプリケーションは コンテキスト辞書 ここではスラングを手動で追加したり、Gmail アカウントから特定の名前やキーワードをインポートしたりできます。

Google AI エッジ ギャラリー

Google は App Store に 2 つの AI Edge アプリケーションを用意しています。これは、Eloquent に加えて、 AI エッジ ギャラリー。この 2 番目のアプリケーションは基本的に、最新のものを含む Gemma ファミリのモデル全体をデバイス上で実行できるテスト環境です。 ジェマ 3n そして ジェマ4。機能 AIチャット&シンキング ギャラリー アプリケーションの機能を使用すると、モデルの段階的な推論プロセスをリアルタイムで確認できます。アプリには以下も含まれます プロンプトとベンチマークツールの実験室 これにより、さまざまなオープンウェイト モデルがハードウェア上でどのように動作するかをテストできます。

Gemma 4 は、自分のコンピューター上で AI を実行できるオープン モデルのファミリーとして最近発売されました。 ローカルマシンに高度な推論機能をもたらす。ファミリーにはサイズが含まれます E2B そして E4B 携帯電話用、およびより大きなバリエーションの 26B そして 31B デスクトップコンピュータ用。これらのモデルは、次の「コンテキスト ウィンドウ」をサポートしています。 128Kに達する 256K より大きなバリエーションでは。

Google AI Edge Eloquent と AI Edge Gallery が利用可能

Google AI Edge Eloquent も AI Edge Gallery も、iOS 以外のオペレーティング システムではまだ利用できません。 「デスクトップ版を含む他のプラットフォームを評価中」。地域ごとの利用可能状況については、 イギリススイス そして 欧州経済地域 」は規制上の承認要件により現在制限されています。 当社は必要な承認を取得し、これらの分野にすぐに拡大できるよう積極的に取り組んでいます。‘。