画像認識がより身近な機能になりそうなニュースです。
Googleは12/2、Google Cloudでも利用されている“強力な画像認識機能”を簡単に扱えるAPI
「Google Cloud Vision API」を発表しました。
画像認識とは、画像に映っているものが何かを判別する機能のこと。
これまでGoogle Cloudの写真管理などでは、写真に映っているものを検索ワードとすることで検索ができるという、高レベルな画像認識機能を提供されていました。
その画像認識機能を「Google Cloud Vision API」では、外部のアプリケーションでも利用できるようになります。
形式としては一般的なREST API形式。
インターネットを経由し、画像を対象のAPI URLへ送信することで認識結果がGoogleから返却されます。
Raspberry Piからの利用も可能とのことから、自作のデバイス・ロボットのカメラから取得した映像をAPIに送ることで、画像認識を用いたコントロールが気軽に行えることが期待されます。
紹介されている機能としては以下の通り。
- 人の顔検知:
人の「顔の向」きや「表情からの感情推測」を判定 - 物体検知:
映っているものが何かを判定(それが「メガネ」か「バナナ」か etc.)
詳細な技術情報はこちらに整理されています。
– Comment –
単純に「観せるだけの表現」だけでなく、観衆を「表現に引き込む・参加させる」というインスタレーションやデジタルサイネージなどが増えてきています。
そんな中で画像認識は、オープンな技術が提供されているものの、利用には専門的な理解が相応に求められていました。
今回の「Cloud Vision API」はその壁を壊すインパクトがあるのではないでしょうか。
APIであるため、インターネットを経由する分の通信タイムラグなどどの程度発生するのか等、実用に向けてはテストも必要です。
現時点ではLIMITED PREVIEWという位置付けのようですが、いち早く積極的に活用したいですね。
ソース:
最後までお読みいただき、ありがとうございました。
音楽・エンターテインメントとテクノロジーに焦点を当て 「音楽・エンターテインメントが持つ魅力・パワーを高め、伝える体験(演出や技術、それらを活用したマーケティング施策など)」、 「アーティストやクリエイター、音楽業界がよりエンパワーメントされるような仕組み(エコシステムや新しいビジネスの在り方)」 を発信・創造していくことに取り組んでいるクリエイティブ・テクノロジスト/ライター。 「SXSW2017 Trade Show」出展コンテンツ制作やレポート発信をきっかけに、イベント・メディアへ登壇・出演。その他、LIVE演出やVJの技術開発にも取り組んでいる。