Sora 開放 Plus & Pro 使用!提示詞限制 & 建議一次看,本週你必須關注的 5 件 AI 大事!

2024-12-13

424

本週 AI 技術熱點不容錯過!從 Sora 的革命性影片生成工具引爆全網,到 Gemini 2.0 的 Realtime API 精準地照片分析與地理定位,再到 Canvas 為寫作和程式設計提供無縫整合的創作工具,本週 AI 技術進展令人目不暇給!OpenAI 的 Sora 剛上線就讓創意影片製作變得前所未有的輕鬆;Gemini 2.0 的 Deep Research 讓研究效率提升數倍;而 Google 則以 Android XR 開創了沉浸式未來,展示了 XR 生態系統的無限可能。

萬眾矚目的 Sora 玩了嗎?提示詞限制 & 建議一次看


圖片來源: Sora


上週被洩露、這週就開放? 本周 OpenAI 的 Sora 終於正式上線,上線當天網站一度被擠爆,目前這個版本已經開放給 Plus 及 Pro 用戶使用,除了歐洲地區因為法律關係還不能使用外,其他地區皆可以使用囉!讓影片創作變得前所未有的簡單!


Sora 不僅僅是普通的影片生成工具,它能夠創建各種不同長寬比的長達20秒的輸出,對於「人物」和「動物」的刻劃更是達到了令人驚嘆的水準。不過,OpenAI 也設置了一些使用限制,比如禁止涉及真實人物、未成年人或受版權保護的內容。那些常用的「模仿 XXX 風格」在 Sora 上可是行不通的!


在 Reddit 上也有人分享「使用 Sora 進行 32 組提示詞的測試」,並且提供完整的影片及測試感想,整理出 Sora 的提示詞指南,以下整理讓大家可以快速上手 Sora 的提示詞寫法,也附上原文連結,讓有興趣的同好可以研究。


來源: Reddit


提示詞的黃金準則:

  1. 簡潔:控制在120字以下
  2. 具體:聚焦1-2個主要視覺元素
  3. 形象:使用富有想像力的描述
  4. 避免敏感:遠離爭議性內容
  5. 可執行:保持邏輯和清晰


提示詞評估指南:

  • 清晰度:提示是否簡潔易懂?
  • 吸引力:能否激發想像?
  • 專注度:細節是否可實現?
  • 語氣:是否具有創意和趣味性?
  • 安全性:是否避免敏感內容?


為什麼重要? 

想像一下,以後只需要動動腦筋,就能立即將腦中的創意轉化為生動的影片。Sora 不僅改變了影片製作方式,更是為創意工作者打開了無限可能的大門!準備好用 Sora 釋放你的創意潛能了嗎?趕快來體驗這個革命性的 AI 工具吧!🎬✨



ChatGPT 4o 新功能 Canvas 開放給全用戶了!


圖片來源: OpenAI


還記得以前寫作和編程時需要反覆切換不同工具和視窗的麻煩嗎?現在,OpenAI 的 Canvas 功能徹底改變了這一切!這個超強大的寫作和程式編輯工具已經全面開放給所有用戶,包括免費用戶,讓創作變得前所未有的輕鬆!


Canvas 最早於2023年10月推出,原本僅限於付費用戶使用。現在,所有用戶都可以享受這項革命性的創作工具,無論是寫作還是程式設計,都將變得更加高效和智能。


Canvas 的主要優點: 

🖋️ 即時反饋:編輯實時可見修改結果 

💻 程式碼支持:直接運行 Python 等多種語言 

🤖 智能整合:可與自訂 GPT 模型無縫銜接 

⚡ 高效協作:與 AI 即時互動、獲得建議 

🌐 多語言支持:支持 JavaScript、Java 等多種程式語言


如何使用 Canvas:

  1. 找到入口:在 ChatGPT 模型選擇中,選擇 With canvas 的版本
  2. 啟動模式:輸入「使用 Canvas」等指令
  3. 即時修改:右側工作區即可預覽修改效果


為什麼重要? 

想像一下,以後寫作和程式設計可以如此輕鬆!Canvas 不僅改變了我們的創作方式,更是為所有用戶打開了智能創作的大門。準備好用 Canvas 釋放你的創造力了嗎?趕快來體驗這個革命性的 AI 工具吧!🚀✨


Google 推出新系統 Android XR!沉浸式未來即將到來!


圖片來源: Google


你還記得當科技不斷進步時,XR裝置(擴增實境、虛擬實境)卻一直缺乏一個真正強大的作業系統嗎?現在好了,Google 帶來了一個改變未來的全新解決方案—— Android XR!這個系統是專為 XR 裝置設計的平台,結合 Google 在 AI、AR 和 VR 領域的最先進技術,讓沉浸式體驗變得前所未有的流暢和自然!


這次的核心亮點是嵌入了 Google 最強大的 Gemini AI 助理。不僅能用語音控制裝置、查詢資訊,還能讓你和虛擬物件互動,彷彿世界就掌握在你的手中!


Android XR 的主要特點:

🔹 整合 Gemini AI:提供最直覺、最自然的人機互動體驗,使用者可以輕鬆控制並與環境互動。

🔹 應用程式支援:全面支援多款 Google 應用,包括 YouTube、Google Maps、Google TV,甚至還相容現有的 Android 應用,讓過渡無縫銜接。

🔹 沉浸式體驗:無論是通過虛擬大螢幕觀影,還是使用 Immersive View 探索城市地標,Android XR 都帶來難以置信的視覺享受!

🔹 硬體合作:Google 與三星合作開發的 Project Moohan,結合 Snapdragon XR2 Gen 2 處理器,提供流暢的跨實境切換功能,預計 2025 年推出。


Project Moohan 的創新亮點

Project Moohan 是首款搭載 Android XR 的硬體裝置,名字來源於韓語「無限」,象徵著無窮的沉浸式可能。

🔸 先進設計:採用最尖端的顯示技術與多模態輸入系統,讓使用者長時間使用也能感到舒適。

🔸 自由切換:能在虛擬與現實環境間實現無縫切換,提供更加自然的操作體驗。

🔸 開發計劃:Google 將針對 XR 生態系統推出更多應用與遊戲,並持續吸引開發者參與,壯大平台力量。


為什麼重要?

Android XR 不僅是個新系統,還代表了科技發展的一個全新里程碑。Google 以其強大的技術實力,將 AI 與 XR 無縫結合,徹底顛覆我們的使用習慣。未來,從玩遊戲到查資訊,從看電影到與世界互動,一切都將因 Android XR 變得更輕鬆、更自然。Apple 和其他競爭對手,真的該小心了!準備好探索 XR 新世界了嗎?趕快關注 Android XR,開啟你的沉浸式未來吧!✨


Gemini 2.0 升級 DeepSearch!研究效率大革命!


圖片來源: Google


還在花上幾小時搜尋和整理資料嗎?現在有了 Google 最新的 Gemini 2.0 和全新功能 Deep Research,你可以在短短幾分鐘內完成一份專業級的研究報告!無論是學生、研究人員,還是商業專案負責人,這個功能都將成為你的最佳助手,讓深度研究不再是繁瑣的任務。


Deep Research 的主要特點:

🔹 專業研究助理角色:Deep Research 能幫助用戶快速搜尋網路資源,撰寫詳細的研究分析報告。只需通過對話式互動,讓 AI 明確主題需求,剩下的交給它!

🔹 多步研究計畫:當遇到複雜主題時,Gemini 會自動建立「多步研究計畫」,使用者可編輯或批准,確保研究方向符合需求。

🔹 資料搜尋與報告生成:Deep Research 能快速檢索公開網路上的資訊,分析後整理成清晰、條理分明的報告,並附上來源連結,讓資料更可靠!

🔹 功能限制:目前該功能僅對 付費進階版 Gemini Advanced 用戶 和訂閱 Google One AI Premium 方案的用戶 開放,且僅支援英文介面。


Gemini 2.0 的其他亮點:

Gemini 2.0 不僅僅是個升級版 AI 模型,還帶來更多驚喜:

🔸 即時策略輔助:專為遊戲玩家設計,能在遊戲中即時提供建議,幫助玩家快速掌握規則並制定最佳策略。

🔸 全面性能提升:無論是對話能力還是問題解決效率,Gemini 2.0 在每一處都展現出它的實力。


如何使用 Deep Research:

  1. 確定資格:確認你是付費進階版 Gemini Advanced 用戶或 Google One AI Premium 訂戶。
  2. 提出需求:通過對話框向 AI 輸入需要研究的主題或問題。
  3. 獲取報告:Gemini 將快速搜尋資料,並生成一份完整的報告,附帶引用來源供參考。
  4. 多步調整:根據 AI 提供的多步計畫,進一步細化研究方向,確保結果精準無誤。


為什麼重要?

Deep Research 的推出徹底顛覆了我們處理深度研究的方式。從繁瑣的資料搜尋到報告撰寫,Gemini 2.0 讓整個過程自動化、高效化。這不僅節省了時間,還大幅提高了研究品質,為個人和企業都帶來了極大的便利。

想像一下,以後再也不需要熬夜整理報告,Deep Research 就是你的專業研究助手!準備好讓工作和學習更加輕鬆高效了嗎?趕快試試這個強大的功能吧!✨


Gemini 2.0 看照片猜地理位置?Realtime API 功能揭密!


圖片來源: @Olivia Moore


你有沒有想過 AI 能夠幫你分析你現在正在看到的每一個畫面,並能瞬間告訴你地點、細節,甚至相關故事?現在,Google 最新推出的 Gemini 2.0 Realtime API 正是這樣的黑科技!無論是看電影猜彩蛋,還是與遊戲進行即時互動,這個多模態 AI 功能都能帶來無與倫比的即時體驗。


Realtime API 的主要特點

🔹 多模態輸入:支持音訊和影像的即時串流輸入,用戶可以通過語音、影像與 AI 互動。例如,透過照片詢問地理位置,或使用語音命令要求即時回答問題。

🔹 即時反應:無需等待,AI 能快速處理請求並提供即時反饋,特別適合遊戲、即時聊天或其他需要快速反應的情境。

🔹 內建工具整合:支持 Google 搜尋、程式碼執行等功能,讓應用不僅能即時回應,還能執行特定計算任務或獲取最新資訊。

🔹 簡化開發流程:開發者可輕鬆利用此 API 建立多模態應用,免去繁瑣編碼,大幅縮短開發時間和成本。


Realtime API 的實際應用

  1. 照片識別與地理定位:用戶可上傳一張地標照片,AI 立即告訴你拍攝地點、相關歷史,以及其他有趣背景資訊。
  2. 即時娛樂助理:看電影時,詢問 AI 某個橋段是否致敬某部電影,或直接了解導演、演員等影片細節。
  3. 遊戲互動輔助:在遊戲中,使用語音指令請求建議,例如「在這場戰鬥中,應該怎麼佈局?」AI 會即時提供最佳策略。
  4. 即時數據可視化:如在演示中,用戶用語音輸入「以長條圖比較《教父》和《奧本海默》的時長」,AI 立即生成圖表,並可隨時添加更多比較資料。


如何使用 Realtime API

  1. 了解開放範圍:Realtime API 為 Gemini 2.0 高級版功能,需具備相關資格才能使用。
  2. 設置多模態應用:開發者可將 API 整合至應用程式,支持音訊、影像和文字等多模態輸入。
  3. 即時互動體驗:無論是用戶還是開發者,都能利用 API 的快速反應能力,提升互動體驗。


為什麼重要?

Gemini 2.0 的 Realtime API 為多模態應用開創了全新可能。從即時反應到資料可視化,從地理定位到電影分析,它不僅改變了我們使用 AI 的方式,也為開發者提供了前所未有的便利工具。未來的應用程式,將變得更智能、更互動、更即時!

還在等什麼?趕快體驗 Gemini 2.0 Realtime API 的強大功能,讓你的日常生活和工作充滿科技的魔力吧!✨



點擊👉註冊並訂閱AI郵報頻道或使用邀請碼 KP04 註冊,就可下載<2024 必備!全網最多人使用的前 50 個 AI 工具 PDF> 掌握最新AI趨勢與技術,讓你 AI 大事不漏追!我們會更用心製作出優質內容唷!


AI郵報

153 Followers

在AI和數據革命的推動下,商業世界正在快速變革!本頻道將帶您探索AI + DATA如何重塑商業模式、推動數位轉型,並為全球帶來就業和經濟機會。 我們的內容包含: ◆每週AI大事追蹤:即時掌握全球AI最新發展和重大事件。 ◆AI與商業未來:從Google未來總監的預測到AI演進史,幫助您洞察未來科技趨勢。 ◆產業變革與數位轉型:揭示Netflix、Spotify等企業如何通過AI提升數位價值,並探索製造業與數據驅動的新世代轉型。 ◆人機協作與新型企業模式:AI時代的數位轉型,助力企業理解AI如何實踐於業務中,創造全新價值。 每週更新高質量的圖文內容,讓您緊跟AI與商業世界的最新動態,無論您是行業專業人士還是對AI感興趣的初學者,都能在這裡找到前瞻見解與實用知識。
文件下載
2024 必備!全網最多人使用的AI工具大公開.pdf
知識主題
AI科技新知

我們使用本身的Cookie和第三方的Cookie進行分析,並根據您的瀏覽習慣和個人資料向您展示與您的偏好相關的廣告。如欲瞭解更多資訊,您可以查閱我們的隱私權政策