2024-12-13
424
本週 AI 技術熱點不容錯過!從 Sora 的革命性影片生成工具引爆全網,到 Gemini 2.0 的 Realtime API 精準地照片分析與地理定位,再到 Canvas 為寫作和程式設計提供無縫整合的創作工具,本週 AI 技術進展令人目不暇給!OpenAI 的 Sora 剛上線就讓創意影片製作變得前所未有的輕鬆;Gemini 2.0 的 Deep Research 讓研究效率提升數倍;而 Google 則以 Android XR 開創了沉浸式未來,展示了 XR 生態系統的無限可能。
上週被洩露、這週就開放? 本周 OpenAI 的 Sora 終於正式上線,上線當天網站一度被擠爆,目前這個版本已經開放給 Plus 及 Pro 用戶使用,除了歐洲地區因為法律關係還不能使用外,其他地區皆可以使用囉!讓影片創作變得前所未有的簡單!
Sora 不僅僅是普通的影片生成工具,它能夠創建各種不同長寬比的長達20秒的輸出,對於「人物」和「動物」的刻劃更是達到了令人驚嘆的水準。不過,OpenAI 也設置了一些使用限制,比如禁止涉及真實人物、未成年人或受版權保護的內容。那些常用的「模仿 XXX 風格」在 Sora 上可是行不通的!
在 Reddit 上也有人分享「使用 Sora 進行 32 組提示詞的測試」,並且提供完整的影片及測試感想,整理出 Sora 的提示詞指南,以下整理讓大家可以快速上手 Sora 的提示詞寫法,也附上原文連結,讓有興趣的同好可以研究。
來源: Reddit
想像一下,以後只需要動動腦筋,就能立即將腦中的創意轉化為生動的影片。Sora 不僅改變了影片製作方式,更是為創意工作者打開了無限可能的大門!準備好用 Sora 釋放你的創意潛能了嗎?趕快來體驗這個革命性的 AI 工具吧!🎬✨
還記得以前寫作和編程時需要反覆切換不同工具和視窗的麻煩嗎?現在,OpenAI 的 Canvas 功能徹底改變了這一切!這個超強大的寫作和程式編輯工具已經全面開放給所有用戶,包括免費用戶,讓創作變得前所未有的輕鬆!
Canvas 最早於2023年10月推出,原本僅限於付費用戶使用。現在,所有用戶都可以享受這項革命性的創作工具,無論是寫作還是程式設計,都將變得更加高效和智能。
🖋️ 即時反饋:編輯實時可見修改結果
💻 程式碼支持:直接運行 Python 等多種語言
🤖 智能整合:可與自訂 GPT 模型無縫銜接
⚡ 高效協作:與 AI 即時互動、獲得建議
🌐 多語言支持:支持 JavaScript、Java 等多種程式語言
想像一下,以後寫作和程式設計可以如此輕鬆!Canvas 不僅改變了我們的創作方式,更是為所有用戶打開了智能創作的大門。準備好用 Canvas 釋放你的創造力了嗎?趕快來體驗這個革命性的 AI 工具吧!🚀✨
你還記得當科技不斷進步時,XR裝置(擴增實境、虛擬實境)卻一直缺乏一個真正強大的作業系統嗎?現在好了,Google 帶來了一個改變未來的全新解決方案—— Android XR!這個系統是專為 XR 裝置設計的平台,結合 Google 在 AI、AR 和 VR 領域的最先進技術,讓沉浸式體驗變得前所未有的流暢和自然!
這次的核心亮點是嵌入了 Google 最強大的 Gemini AI 助理。不僅能用語音控制裝置、查詢資訊,還能讓你和虛擬物件互動,彷彿世界就掌握在你的手中!
🔹 整合 Gemini AI:提供最直覺、最自然的人機互動體驗,使用者可以輕鬆控制並與環境互動。
🔹 應用程式支援:全面支援多款 Google 應用,包括 YouTube、Google Maps、Google TV,甚至還相容現有的 Android 應用,讓過渡無縫銜接。
🔹 沉浸式體驗:無論是通過虛擬大螢幕觀影,還是使用 Immersive View 探索城市地標,Android XR 都帶來難以置信的視覺享受!
🔹 硬體合作:Google 與三星合作開發的 Project Moohan,結合 Snapdragon XR2 Gen 2 處理器,提供流暢的跨實境切換功能,預計 2025 年推出。
Project Moohan 是首款搭載 Android XR 的硬體裝置,名字來源於韓語「無限」,象徵著無窮的沉浸式可能。
🔸 先進設計:採用最尖端的顯示技術與多模態輸入系統,讓使用者長時間使用也能感到舒適。
🔸 自由切換:能在虛擬與現實環境間實現無縫切換,提供更加自然的操作體驗。
🔸 開發計劃:Google 將針對 XR 生態系統推出更多應用與遊戲,並持續吸引開發者參與,壯大平台力量。
Android XR 不僅是個新系統,還代表了科技發展的一個全新里程碑。Google 以其強大的技術實力,將 AI 與 XR 無縫結合,徹底顛覆我們的使用習慣。未來,從玩遊戲到查資訊,從看電影到與世界互動,一切都將因 Android XR 變得更輕鬆、更自然。Apple 和其他競爭對手,真的該小心了!準備好探索 XR 新世界了嗎?趕快關注 Android XR,開啟你的沉浸式未來吧!✨
還在花上幾小時搜尋和整理資料嗎?現在有了 Google 最新的 Gemini 2.0 和全新功能 Deep Research,你可以在短短幾分鐘內完成一份專業級的研究報告!無論是學生、研究人員,還是商業專案負責人,這個功能都將成為你的最佳助手,讓深度研究不再是繁瑣的任務。
🔹 專業研究助理角色:Deep Research 能幫助用戶快速搜尋網路資源,撰寫詳細的研究分析報告。只需通過對話式互動,讓 AI 明確主題需求,剩下的交給它!
🔹 多步研究計畫:當遇到複雜主題時,Gemini 會自動建立「多步研究計畫」,使用者可編輯或批准,確保研究方向符合需求。
🔹 資料搜尋與報告生成:Deep Research 能快速檢索公開網路上的資訊,分析後整理成清晰、條理分明的報告,並附上來源連結,讓資料更可靠!
🔹 功能限制:目前該功能僅對 付費進階版 Gemini Advanced 用戶 和訂閱 Google One AI Premium 方案的用戶 開放,且僅支援英文介面。
Gemini 2.0 不僅僅是個升級版 AI 模型,還帶來更多驚喜:
🔸 即時策略輔助:專為遊戲玩家設計,能在遊戲中即時提供建議,幫助玩家快速掌握規則並制定最佳策略。
🔸 全面性能提升:無論是對話能力還是問題解決效率,Gemini 2.0 在每一處都展現出它的實力。
Deep Research 的推出徹底顛覆了我們處理深度研究的方式。從繁瑣的資料搜尋到報告撰寫,Gemini 2.0 讓整個過程自動化、高效化。這不僅節省了時間,還大幅提高了研究品質,為個人和企業都帶來了極大的便利。
想像一下,以後再也不需要熬夜整理報告,Deep Research 就是你的專業研究助手!準備好讓工作和學習更加輕鬆高效了嗎?趕快試試這個強大的功能吧!✨
圖片來源: @Olivia Moore
你有沒有想過 AI 能夠幫你分析你現在正在看到的每一個畫面,並能瞬間告訴你地點、細節,甚至相關故事?現在,Google 最新推出的 Gemini 2.0 Realtime API 正是這樣的黑科技!無論是看電影猜彩蛋,還是與遊戲進行即時互動,這個多模態 AI 功能都能帶來無與倫比的即時體驗。
🔹 多模態輸入:支持音訊和影像的即時串流輸入,用戶可以通過語音、影像與 AI 互動。例如,透過照片詢問地理位置,或使用語音命令要求即時回答問題。
🔹 即時反應:無需等待,AI 能快速處理請求並提供即時反饋,特別適合遊戲、即時聊天或其他需要快速反應的情境。
🔹 內建工具整合:支持 Google 搜尋、程式碼執行等功能,讓應用不僅能即時回應,還能執行特定計算任務或獲取最新資訊。
🔹 簡化開發流程:開發者可輕鬆利用此 API 建立多模態應用,免去繁瑣編碼,大幅縮短開發時間和成本。
Gemini 2.0 的 Realtime API 為多模態應用開創了全新可能。從即時反應到資料可視化,從地理定位到電影分析,它不僅改變了我們使用 AI 的方式,也為開發者提供了前所未有的便利工具。未來的應用程式,將變得更智能、更互動、更即時!
還在等什麼?趕快體驗 Gemini 2.0 Realtime API 的強大功能,讓你的日常生活和工作充滿科技的魔力吧!✨
點擊👉註冊並訂閱AI郵報頻道或使用邀請碼 KP04 註冊,就可下載<2024 必備!全網最多人使用的前 50 個 AI 工具 PDF> 掌握最新AI趨勢與技術,讓你 AI 大事不漏追!我們會更用心製作出優質內容唷!
AI郵報
153 Followers
AI郵報
153 Followers
我們使用本身的Cookie和第三方的Cookie進行分析,並根據您的瀏覽習慣和個人資料向您展示與您的偏好相關的廣告。如欲瞭解更多資訊,您可以查閱我們的隱私權政策。