OpenAI の 12 日間のイメージ

OpenAIは今年12月にAIアップデート戦略に独創的な工夫を加え、 アドベントカレンダーにヒントを得たアプローチ. と名付けられた 「OpenAIの12日間」, このキャンペーンでは、12 月 5 日から 12 日間にわたって 12 のエキサイティングな発表が行われる予定です。 

「12 Days of OpenAI」とは何ですか?

同社は毎日午前 10 時 (太平洋標準時) にライブ ストリームを配信し、画期的なリリースから小規模で段階的な改善まで、さまざまな新機能、アップデート、モデルを公開しています。OpenAI の CEO である Sam Altman 氏は、これらのアップデートを「大きなもの」と「クリスマスプレゼントに詰めるプレゼント」のミックスと表現し、AI コミュニティに次に何が起こるのかを予想させています。

このユニークな展開は大きな話題を呼んだだけでなく、ホリデーシーズン中にイノベーションを魅力的かつアクセスしやすいものにするという OpenAI の取り組みを強化することにもなりました。このアップデートは、AI 機能を継続的に改良しながら、常に進化する人工知能の世界にユーザーをワクワクさせ続けるという同社の使命を強調しています。

キャンペーンはライブ配信から始まりました 12月5日は、OpenAI の毎日のアップデートの第一弾を披露しました。アルトマン氏によると、この取り組みの背後にあるアイデアは、開発者と一般ユーザーの両方に応える一連のリリースでユーザーを驚かせ、喜ばせることです。 

新しい AI モデルを導入したり、便利な機能を発表したりすることで、OpenAI は研究とテクノロジーの奥深さと多様性を披露することを目指しています。これまでにリリースされたものを見てみましょう。

1日目: o1 OpenAI モデルと ChatGPT Pro 

OpenAI は、待望の o1 OpenAI モデルと ChatGPT Pro のリリースで 12 Days シリーズを開始し、AI を活用したインタラクションの新しい標準を確立しました。9 月にプレビューとして最初に導入された o1 モデルは、大幅なアップグレードを施して正式にリリースされました。 

OpenAIはo1と並行して、最先端のAIツールへの継続的なアクセスを必要とする上級ユーザー向けに設計された月額$200のプレミアムサブスクリプション層であるChatGPT Proを発表しました。

出典: OpenAI

o1 OpenAIモデルとChatGPT Proに何を期待できるか

より高速、よりスマート、より正確で、強化された推論と自己評価された事実により、信頼性を確保しながら複雑な現実世界の問題に取り組むことができます。その際立った機能の 1 つは、マルチモーダル機能です。これにより、ユーザーはテキストと画像の両方を処理および分析できます。これは、図や手描き画像などの視覚データを解釈する必要がある専門家にとって画期的な進歩です。

出典: OpenAI

プロユーザーには、最新の o1 モデル、 高度な音声機能、研究主導型アプリケーションへの優先アクセス。このサービスは、微妙な現実世界の課題を解決するために AI を利用する専門家や研究者向けに特別に設計されています。

OpenAI は、o1 モデルの堅牢性と安全性を確保するための措置も講じています。広範なテストとアーキテクチャの強化により、制御性と信頼性を維持しながらパフォーマンスが向上しました。 

今後、OpenAI は、Web ブラウジングやファイルのアップロードなどの追加機能をシステムに統合し、モデルの汎用性をさらに拡大する予定です。イノベーションと影響力への取り組みの一環として、OpenAI は、医療研究者に無料の ChatGPT Pro サブスクリプションを提供する助成金プログラムを発表し、重要な分野における AI の変革の可能性へのアクセスを確保しています。 

これらの開発は、AI テクノロジーの限界を押し広げ、世界中のユーザーが AI テクノロジーにアクセスし、影響力を発揮できるようにするという OpenAI の取り組みを示しています。

o1 OpenAI モデルと ChatGPT Pro に関するユーザーの意見

一部のユーザーは、OpenAI の o1 Pro は月額 $200 という価格に見合うほどの改善を提供していないと感じています。また、Claude Sonnet 3.5 などの安価な代替品と比較すると、OpenAI の価格体系が魅力を損なっていると感じているユーザーもいます。

Reddit ユーザーは、OpenAI がアーキテクチャ上の大きな進歩もないのに o1 Pro の機能を誇張しすぎていると批判した。OpenAI が下位プランに厳しいトークン制限を設け、ユーザーを高価なオプションに追いやっていることに対する不満が高まっている。

複雑な問題の解決: 微妙な推論が評価されている一方で、o1 Pro の改善はほとんどのタスクでは限界があると見なされることがよくあります。

2日目の発表: OpenAI の強化ファインチューニング研究プログラム

OpenAIの「12 Days of OpenAI」イベントの2日目に、大きな発表が行われました。 強化ファインチューニング(RFT)研究プログラム開発者と機械学習エンジニアを支援するために設計されたこのイニシアチブは、特定のドメインに重点を置いたタスクで優れたパフォーマンスを発揮するようにカスタマイズされたエキスパートモデルの作成を可能にします。OpenAI は RFT によって、AI モデルでカスタマイズを実現する方法を再定義し、汎用モデルと専門知識の間のギャップを埋めることを目指しています。

強化の微調整とは何ですか?

強化ファインチューニングは、AI モデルをカスタマイズするための新しいアプローチです。従来のファインチューニング方法とは異なり、RFT は報酬によって駆動されるフィードバック ループを使用して、数十から数千の高品質タスクでモデルをトレーニングします。開発者はモデルの推論プロセスをガイドする参照回答を提供して、ドメイン固有のアプリケーションでのパフォーマンスと精度を向上させることができます。 

この反復プロセスにより、モデルが望ましい動作に適合しやすくなり、法律、医療、金融などの分野にわたる複雑で微妙な問題を処理できるようになります。

このプログラムに参加する開発者や組織は、OpenAI の RFT 用アルファ API にアクセスできます。これにより、独自のタスク用にモデルを試したり改良したりすることができます。また、このプログラムでは、API の公開前に、API の将来を形作るフィードバックを提供する機会も提供されます。 

参加者は OpenAI と共同で作業することで、最先端のツールへの早期アクセスのメリットを享受しながら、この技術の進歩に貢献できます。

RFT は、結果が客観的に正しい答えとなるような、専門家主導の複雑なタスクを実行する組織に特に適しています。保険、エンジニアリング、金融などの業界は、このアプローチを通じて AI 支援を取り入れることで大きな利益を得ることができます。OpenAI は、研究機関、大学、企業、特に AI を活用してワークフローを最適化および革新することに関心のある企業からの応募を奨励しています。

どのように機能しますか?

RFT は OpenAI の開発者ダッシュボードにシームレスに統合され、ユーザーは最小限のラベル付きデータでモデルを微調整したり知識を抽出したりできます。プロセスには次のものが含まれます。

  1. トレーニングデータの提供開発者は、トレーニング セットと検証セットに分割された構造化データセットを提供します。
データセットの単一インスタンスの例
出典: OpenAI
  1. グレーディング出力: カスタム「グレーダー」システムを使用して、モデルの応答は、望ましい結果との整合性を反映するスコアで評価されます。
  2. 報酬シグナルモデルはこれらのスコアに基づいてアプローチを反復的に改良し、複数のサイクルを通じて改善していきます。
  3. 検証定期的な検証により、モデルがデータを記憶するだけでなく、適切に一般化されていることが保証されます。

OpenAI の強化微調整研究プログラムに関するユーザーの意見

多くの人は、強化微調整が社内ナレッジ管理やカスタマー サービス ボットなど、特定のビジネス ニーズに合わせた AI を作成するための変革をもたらすと考えています。ユーザーは、強化微調整を検索拡張生成 (RAG) と比較することが多く、特定のタスクに対する補完的または潜在的に優れたアプローチと見なしています。

評価システム、ニッチなドメイン向けの専門的なトレーニング、あまり知られていないプログラミング言語向けの微調整されたモデルなどのユースケースに対する熱意。強化微調整は、より効率的で専門的な学習の可能性を秘めているため、汎用知能への重要な一歩であると考える人もいます。

3日目: ソラ

月曜日に、 オープンAI CEOサム・アルトマンは、 ソラ, 同社は、ライブストリーム「12 Days of OpenAI」で、長らく待望されていたAI搭載のビデオ生成ツール「Sora」を発表しました。ChatGPT PlusおよびProのユーザーが一部の国(英国とEUを除く)で現在利用できるSoraは、フォトリアリスティックなビジュアルと直感的なユーザーツールを組み合わせたAIビデオ作成の大きな飛躍を示しています。

出典: OpenAI

ソラとは何ですか?

Soraを使用すると、ユーザーは簡単なテキストプロンプト、画像、または詳細なストーリーボードからビデオを生成でき、比類のないクリエイティブコントロールを提供します。sora.comのスタンドアロンプラットフォームからアクセスできるこのツールには、 探索タブ ユーザーが作成したコンテンツを発見し、各動画の背後にある手法を学ぶことができます。 ライブラリタブ ユーザーは、アスペクト比、解像度(最大 1080p)、期間(最大 20 秒)などの設定や、「ストップ モーション」や「バルーン ワールド」などのプリセットによるビジュアル スタイルを選択して、作品の作成を開始できます。

上級クリエイター向け ストーリーボード は、従来のツールと同様のビデオ編集の柔軟性を提供する傑出した機能です。各フレーム、つまり「ストーリーボード カード」は、テキスト プロンプトまたは画像のアップロードから作成できます。再カット (フレームの並べ替え)、リミックス (シーケンス要素の調整)、ループ (セグメントの繰り返し)、ブレンド (シームレスなトランジション) などの機能により、洗練された方法で物語を形作ることができます。

Sora は、クリエイターに取って代わるのではなく、クリエイターを支援することを目指しています。AI ツールが芸術的なコンテンツを悪用する可能性についての批判に応えて、OpenAI は Sora がクリエイターを支援する「拡張機能」であることを強調しました。このプラットフォームは、短編ストーリーテリングの実験に強力な機能を提供するため、クリエイティブな専門家、マーケティング担当者、趣味の愛好家に最適です。

このツールは技術的に優れているが、そのトレーニングデータについては疑問が残る。報告によると、Soraはウェブ上の動画から学習した可能性があり、AIの倫理的使用に関する議論が巻き起こっている。OpenAIは次のような安全策を講じている。 C2PA 目に見えない透かし 性的ディープフェイクなどの有害コンテンツに対する規制。

Soraに関するユーザーの意見

多くのユーザーはフリン氏の意見に同意し、Sora は人間のクリエイターに完全に取って代わるものではなく、創造性を増強するツールとして捉えられるべきだと強調しています。一部のユーザーは、Sora や同様のツールは創造的な仕事を商品化し、人間のアーティストや作家の価値を損なう可能性があると感じて不安を表明しています。繰り返し聞かれるのは、Sora が生産性ツールとして称賛されている点です。Sora は、クリエイターがアイデアのプロトタイプを作成し、ワークフローを合理化し、より高度な概念的なタスクに集中できるようにします。Reddit ユーザーは、Sora がクリエイティブ スキルが限られているユーザーに力を与え、プロ仕様のツールへのアクセスを民主化していると見ています。

サブスクリプションの詳細

ChatGPT Plusユーザーは最大 毎月50本の動画 480p 解像度では最大 100 万動画 (720p では動画数が少なくなります)、Pro ユーザーは 10 倍の使用量を楽しむことができます。クリエイターにとってアクセスしやすいエントリ ポイントを提供することで、Sora はビジュアル ストーリーの制作と共有の方法を変革する立場にあります。

4日目: キャンバス

OpenAIの4日目 「OpenAIの12日間」OpenAIが正式に立ち上げ キャンバスは、共同執筆とコーディングを向上させるために設計された革新的なインターフェースです。以前はベータ版だった Canvas は、現在すべての ChatGPT ユーザーがアクセス可能で、生産性と創造性を再定義する強化された AI 搭載ワークスペースを提供します。

キャンバスとは何ですか?

Canvas は ChatGPT 内のサイドバイサイド インターフェースで、ユーザーが AI とよりインタラクティブかつシームレスに共同作業できるようにします。従来のチャット ウィンドウとは異なり、Canvas は別の動的なスペースで開くため、リアルタイムの編集、対象を絞ったフィードバック、包括的な修正が可能になります。これは、Google ドキュメントの共同作業機能とコーディング環境の技術ツールを組み合わせたもので、AI を活用したワークフローに特化して調整されています。

出典: データキャンプ

ChatGPT に統合されているため、ユーザーはプロンプトを介して Canvas を直接呼び出すことも、タスクでその機能が必要になったときに自動的に起動させることもできます。これにより、Canvas はクリエイティブ ライティングと技術プロジェクトの両方に使用できる多目的ツールになります。

Canvas は、ユーザーと AI の間のギャップを埋める直感的なインターフェイスを導入し、ストーリーボード作成、デバッグ、複数ステップの計画などの複雑なタスクをより効率的にします。その幅広いアプリケーションは、原稿を微調整するライターからコードをデバッグする開発者まで、さまざまな業界の専門家や愛好家にとって大きな機能強化を約束します。

Canvas は高度な機能を組み込むことで、テキストの圧縮、コードの翻訳、プロジェクトの視覚的な計画など、ワークフローを効率化するツールをユーザーに提供します。継続的な更新と改良が約束されているため、Canvas は ChatGPT の革新的な追加機能としてさらに位置付けられています。

Canvas はどのように機能しますか?

Canvas は ChatGPT の既存の機能の拡張機能として動作し、次のような主要な機能を提供します。

  • 統合されたPython実行: ユーザーはインターフェース内で Python コードを実行でき、出力、エラー修正、調整をリアルタイムで利用できるため、デバッグ、データ分析、またはクリエイティブ コーディングに利用できます。
  • Canvas を使用したカスタム GPT: カスタマイズされた AI アシスタントが Canvas を活用できるようになり、よりパーソナライズされた強力なユーザー エクスペリエンスが実現します。
  • 強化されたライティングコラボレーション: ライターは、インライン編集提案、読解レベルの調整、テキストの拡張または圧縮オプションなどの機能を利用できます。絵文字などの視覚的なアクセントを組み込んで、トーンを強調することもできます。
  • 高度なコーディングツール: 開発者は、インライン コード レビュー、デバッグ ログ、Python、JavaScript、PHP などのプラットフォーム間での言語移植により、ワークフローを効率化できます。
  • インタラクティブストーリーボード: 複数のステップからなるプロジェクトの場合、Canvas は、ユーザーが作業を効率的に計画するのに役立つ視覚的な計画ツールを提供します。

Canvasに関するユーザーの意見

Canvas は、ブレーンストーミング、プロトタイピング、クリエイティブなアイデアの視覚化のための直感的なツールであり、迅速な反復を可能にするとユーザーから高く評価されています。肯定的なフィードバックは、Canvas のコラボレーションの可能性を強調しており、チームがリアルタイムでアイデアを共同で作成し、改良することが容易になります。

一部のユーザーは、Canvas を Figma や Photoshop などのツールと比較し、AI による機能強化を評価する一方で、ハイエンドのプロ仕様のデザインには範囲が限られていることを批判しています。一方で、有料化や段階的なアクセスの可能性に不満を表明し、Canvas が一般のクリエイターやアマチュアのクリエイターにとってアクセス不能になるのではないかと懸念するユーザーもいます。

5日目: ChatGPTとApple Intelligence 

5日目にOpenAIは Apple Intelligence の ChatGPT そして、Apple エコシステム内で人工知能が実行できることの限界を拡大するように設計された一連の機能を導入しました。 

Siri と ChatGPT のネイティブ統合、Writing Tools の機能強化、より直感的なメール アプリ、Image Playground での画像生成、Genmoji や Visual Intelligence などの新機能を含む充実したアップグレード ラインナップを備えた iOS および iPadOS 18.2 の Apple Intelligence は、より統一された実用的な AI エクスペリエンスを目指しています。この野心的なアップデートは以前のリリースを基にしており、Apple Intelligence の最初のロールアウトによって築かれた基盤を改良しています。

クレジット: Apple

ChatGPTとApple Intelligenceとは

最も期待されている追加機能は SiriとChatGPTのネイティブ統合、ユーザーはAppleの音声アシスタントを通じてOpenAIの会話機能をシームレスに利用できるようになります。このアップグレードにより、Siriは詳細なメールの作成、記事の要約、高度なショートカットの生成など、より微妙なタスクを簡単に実行できるようになります。ChatGPTをSiriに組み込むことで、Appleはそれを日常の生産性ニーズとクリエイティブなワークフローをつなぐ多目的アシスタントに変えます。

その他の注目すべき機能は次のとおりです。

  • 強化されたライティングツール: トーン、文法、コンテンツの構成に関する高度な提案を提供し、ライターや専門家に最適です。
  • よりスマートなメールアプリ: メール アプリは、自動メッセージ分類機能により、電子メールをインテリジェントに優先順位付けして整理することで、受信トレイの乱雑さを軽減します。
  • Image Playground での画像生成: ユーザーはプロンプトから直接シンプルなビジュアルを作成できるようになりましたが、この機能は競合他社に比べて洗練度が劣っています。
  • Genmojiとビジュアルインテリジェンスこれらの遊び心がありながらも機能的なツールを使用すると、ユーザーはパーソナライズされた絵文字を作成したり、ドキュメントのスキャンやオブジェクトの認識など、画像から有意義な洞察を抽出したりできます。

Apple の現在の AI 製品は、OpenAI や Anthropic などの競合他社の幅広さと深さにはまだ及ばないかもしれないが、同社の長期的ビジョンを垣間見ることができる。 

Apple は、オペレーティング システムとそのネイティブ アプリに AI を深く組み込むことで、プラットフォーム全体にわたるシームレスなインテリジェンス レイヤーの基礎を築いています。このアプローチは、Apple エクスペリエンスのあらゆる側面に AI が織り込まれ、反復的なタスクを自動化しながらユーザーが創造性と意思決定に集中できるようになる未来を暗示しています。

今のところ、Apple Intelligenceは、 補助的およびエージェント的なAI— 雑務を省き、より効率的なワークフローを実現します。Siri + ChatGPT やよりスマートなメール アプリなどの機能は、AI が人間の創造性を置き換えるのではなく支援し、日常の課題に対する実用的なソリューションを提供する未来を示しています。

ChatGPTとApple Intelligenceに関するユーザーの意見

Apple の AI 機能に対するユーザーの反応はさまざまで、時には役に立つと感じる人もいるが、実用性に欠けることが多い。多くのユーザーはこれらの AI 機能がもたらす価値に懐疑的で、わずかな改善しか感じられないためにデバイスをアップグレードしないことを選択するユーザーもいる。

さらに、AI が生成した要約は、誤解を招く、または無神経な結果を生み出すことがあるため、その正確性について懸念があります。対照的に、ChatGPT は広く採用されており、毎週 3 億人を超えるアクティブ ユーザーがいます。ユーザーは、執筆、調査、コーディング、宿題などのタスクを支援する機能を高く評価しています。

しかし、一部のユーザーからは、事実の信頼性と高度な計算に関する問題が報告されています。OpenAI は、ユーザーからのフィードバックに基づいて ChatGPT を更新し続け、精度、速度、プレゼンテーションの向上に重点を置いています。

最新のニュースをすべてメールで受け取り、AI の変化について詳しく知りたいですか? ニュースレターを購読する 私たちと一緒にテクノロジーを簡素化しましょう。 

タグ:
前の投稿
あなたも気に入るかもしれない

コメントを残す:

メールアドレスが公開されることはありません。 が付いている欄は必須項目です