GoogleのAI「Gemini」はじめました

https://wired.jp/article/google-gemini-ai-model-chatgpt/

Geminiが、徐々にそのベールを脱ぎ始めましたね。この記事にも書かれていますが、最大の特徴は最初からマルチモーダルなんですよね。文字情報だけじゃなく、静止画像も映像も音も、全て最初から取り扱うという意味で、人類が目指すより汎用的なAI(汎用人工知能)の目標を射程に入れて開発されています。私も使っていきたいと思います。

Googleも最初は 文字情報に特化した検索エンジンを開発しましたが、徐々に映像も音声も取り入れることになりましたよね。今ではご存知のように、検索窓に単語を入れた後、出力結果にはタグが上部につき、ニュースなり動画なりを選べるようになりました。

これからますます AI 開発はスピードが上がるでしょうね。だからこそ なおさら 国際的な枠組みを取り入れた、政治的なルール作りやレギュレーションが必要だと思います。

(Photo by Greg Bulla on Unsplash

Translate »