亞馬遜(Amazon)近日推出先進人工智能模型「Nova Act」,旨在打造更聰明的網頁原生(web-native)AI代理(agents)。不同於傳統僅回應查詢的語言模型,Nova Act 被設計為能在數位與實體環境中執行多步驟任務的智能代理,實現如籌劃婚禮或處理複雜IT任務等高難度工作。
Nova Act 的關鍵特點在於其開發套件(SDK),允許開發者建立能於瀏覽器內自動完成任務的AI代理,例如發出休假通知、預約日曆、或自動回覆電郵。SDK 支援將複雜流程分割為「原子指令」(atomic commands),並可整合 Playwright 操控瀏覽器、API 呼叫、Python 腳本及多執行緒處理,進一步提升精確度與效率。
在測試表現方面,Nova Act 在內部基準評估中表現出色,於 ScreenSpot Web Text 測試中取得 0.939 的高分,顯著超越競爭對手如 Claude 3.7 Sonnet(0.900)及 OpenAI 的 CUA(0.883)。在視覺互動測試方面亦具優勢,雖然在 GroundUI 測試上稍遜,但亞馬遜表示這是未來優化的重點。
此外,Nova Act 展現出強大的遷移能力,即使在未曾訓練的環境中如網頁遊戲,也能良好運作。該技術已應用於 Alexa+,使AI助理能自主操作網頁,即便API存取受限亦可完成任務。
Nova Act 被視為亞馬遜推動智能AI代理長遠願景的第一步,未來將透過強化式學習(Reinforcement Learning)持續進化,最終實現具備高度自治與實用性的AI代理。
DeepSeek V3-0324 近日成為 Artificial Analysis Intelligence Index 上得分最高的 非推理(non-reasoning) 模型,超越 Google Gemini 2.0 Pro、Anthropic Claude 3.7 Sonnet 和 Meta Llama 3.3 70B 等專有 AI。雖然仍落後於推理型 AI,如 DeepSeek 自家的 R1 和 OpenAI 產品,但這項成就顯示開源 AI 在低延遲應用上的潛力。
非推理 AI 的新標準
DeepSeek V3-0324 屬於 非推理 AI,即能夠即時生成回應,而無需深度計算,適用於 即時聊天機器人、客服自動化與即時翻譯 等場景。這次更新確立了開源 AI 在這類應用中的領先地位,甚至超越了許多封閉式專有技術。
該模型沿用了 2024 年 12 月版本的主要配置,包括:
- 128k 上下文窗口(API 限制至 64k)
- 6710 億總參數(FP8 精度下需 700GB 以上 GPU 記憶體)
- 370 億活躍參數
- 僅限文本處理(無多模態支持)
- MIT 開源許可證
雖然這款 AI 屬於開源,但其高昂的運算需求仍然限制了普通用戶的直接使用。
目前,專有推理 AI(如 DeepSeek R1)仍在更複雜的任務中佔據優勢,但 DeepSeek V3-0324 已經逐步縮小差距。三個月前,DeepSeek V3 幾乎追上了 Anthropic 和 Google 的非推理型 AI,但仍略遜一籌。如今,V3-0324 已正式超越所有專有非推理 AI,成為業界領先的開源選擇。
專家 Artificial Analysis 形容這次發佈「甚至比 R1 更具突破性」,標誌著 開源 AI 技術競爭力的提升。DeepSeek 的進步顯示,開源框架正在挑戰封閉式 AI,為開發者與企業提供更具彈性的選擇。
OpenAI與Google近日呼籲美國政府採取果斷行動,以確保該國在人工智慧(AI)領域的領導地位。OpenAI在致美國科技政策辦公室的信件中強調,美國的AI發展正面臨中國的競爭,且中國計劃在2030年前超越美國。該公司認為,美國政府應透過新的AI行動計劃(AI Action Plan),確保建立在民主價值觀基礎上的AI技術能夠持續領先,避免受到專制政權的影響。
Google則表示,儘管美國目前在AI領域保持領先地位,但這種優勢並非穩固不變,呼籲政府採取積極措施以維持競爭力。
AI發展戰略與建議
OpenAI指出,AI的發展將帶來與歷史技術變革(如印刷術與電腦發明)同等級的繁榮,並強調「智慧自由」(Freedom of Intelligence)的重要性,呼籲開放存取通用人工智慧(AGI)技術,同時防範專制控制與官僚障礙。該公司提出三大原則:
- AI智能發展與所投入的資源呈對數關係
- AI運行成本每12個月下降10倍
- AI技術提升的時間週期持續縮短
Google則提出三點行動計劃:
- 投資AI基礎建設,包括能源供應、出口管制、研發資金支持及創新政策框架
- 加速政府AI應用,推動多供應商可互操作的AI解決方案,並優化採購流程
- 促進國際AI創新合作,透過技術標準、市場導向政策,以及與盟國合作保障國家安全
此外,兩家公司皆提出政策建議,包括平衡出口管制、加強AI研發、公私合營推動技術發展,以及建立全國統一的AI監管框架,以避免各州政策不一致的問題。
阿里巴巴 Qwen 團隊近日發佈 QwQ-32B,這是一款擁有 320 億參數的人工智慧(AI)模型,其表現堪比規模更大的 DeepSeek-R1,展現了強化學習(Reinforcement Learning, RL)在基礎模型上的潛力。
技術突破與性能表現
QwQ-32B 成功整合了智能代理(Agent)能力,使其能夠進行批判性思考、使用工具並根據環境回饋調整推理。阿里巴巴團隊指出,相較於傳統的預訓練與後訓練方法,擴展 RL 可以顯著提升模型的推理能力。
在多項基準測試(AIME24、LiveCodeBench、LiveBench、IFEval 和 BFCL)中,QwQ-32B 的表現接近 DeepSeek-R1(擁有 6710 億參數,其中 37 億參數被啟用),證明了 RL 在縮小模型規模與性能之間差距的潛力。例如:
- AIME24 測試:QwQ-32B 獲得 79.5 分,接近 DeepSeek-R1 的 79.8 分,顯著領先 OpenAI o1-mini(63.6 分)。
- LiveCodeBench 測試:QwQ-32B 取得 63.4 分,僅略遜於 DeepSeek-R1 的 65.9 分,但顯著超越其他對手。
- 其他測試中,QwQ-32B 亦展現卓越的數學推理、程式編碼與通用問題解決能力。
強化學習的多階段實施
Qwen 團隊採用了冷啟動(Cold-Start)檢查點與多階段 RL 訓練策略。第一階段專注於數學與編碼任務,透過準確性驗證器與程式執行伺服器提升性能。第二階段則擴展至通用能力,結合基於規則的驗證與獎勵模型,在不影響數學與編碼表現的前提下,增強指令理解與智能代理能力。
開源與未來發展
QwQ-32B 以 Apache 2.0 授權開源,可透過 Hugging Face 與 ModelScope 取得,並可在 Qwen Chat 上使用。阿里巴巴計劃持續推進 RL 在長期推理(Long-Horizon Reasoning)中的應用,朝向通用人工智慧(AGI)邁進。
Opera 近日推出了「Browser Operator」,這是一款內建於瀏覽器內的原生 AI 助手,旨在直接於瀏覽器環境內執行各類網絡任務,而無需依賴額外的工具或外部雲端運算。
與傳統 AI 輔助工具不同,「Browser Operator」並非獨立應用程式,而是 Opera 瀏覽器的延伸功能,能夠協助用戶自動化處理繁瑣任務,例如填寫網上表單、購物流程以及網頁內容整理等。
本地運算保護隱私,提升效率
與其他依賴雲端運算的 AI 工具不同,「Browser Operator」的所有運算皆在本地裝置內完成,無需將用戶的敏感數據傳送至第三方伺服器,確保更高的隱私保護。此外,該 AI 助手利用 Opera 自家的 AI Composer Engine,透過自然語言處理技術(NLP)解讀用戶指令,並直接於瀏覽器內執行相應動作。
當「Browser Operator」遭遇涉及高度敏感資訊(如付款詳細資料輸入或訂單確認)時,系統會暫停操作並請求用戶確認,確保使用者擁有絕對的掌控權。此外,用戶可以隨時介入、修正錯誤或撤銷已執行的操作,確保使用體驗的靈活性與可靠性。
核心優勢:隱私、效能與精準度
Opera 的「Browser Operator」相較於競爭對手,具備三大優勢:
- 更快的任務執行速度:不依賴螢幕截圖與視覺分析,而是直接讀取網頁的 Document Object Model (DOM) 樹狀結構,省去額外的計算負擔,提升處理效率。
- 更高的隱私保護:所有操作均在瀏覽器內部進行,無需上傳個人數據至外部伺服器,確保用戶的登入資訊、瀏覽記錄及其他敏感數據不會外洩。
- 更強的網頁互動能力:AI 可直接與隱藏於視圖之外的元素(如彈出式視窗、驗證對話框等)互動,確保操作流暢無阻。
Opera 透過這項創新技術,將瀏覽器從單純的資訊存取工具,轉變為能夠主動提升生產力的智能助手,為用戶帶來更高效、安全與便捷的網絡體驗。
Meta 近日宣布,為了降低存儲成本,Facebook 的直播影片將不再被永久保留,而是會在30天後自動刪除。此變更將於 2025年2月19日 起正式生效,適用於所有新的直播影片。
變更詳情
- 直播影片最多可保存30天,用戶可在此期間內觀看、下載或分享。
- 所有30天以上的舊直播影片將陸續刪除,Meta 會提前通知用戶,並提供 90天 的時間讓用戶下載內容。
- 用戶可將直播影片轉換為 Reels 短片,以便長期保存。
- 若需要額外時間,可申請延長6個月,但最終仍會被刪除。
Meta 表示,大部分直播影片的觀看量都集中在發布後的幾週內,長期存儲這些影片的價值有限。由於該公司計劃 投入約650億美元發展 AI 技術,因此需要削減不必要的開支。
DeepSeek的人工智慧(AI)技術正在快速滲透中國交通運輸領域,從最初的電動汽車(EV)製造商,擴展至電動滑板車(e-scooter)產業,各大企業紛紛導入該技術,以提升產品競爭力。
AI驅動電動車行業變革
根據《南華早報》報導,過去兩週內,已有超過12家中國汽車製造商宣布將DeepSeek的AI技術整合至其車輛當中。其中包括比亞迪(BYD)、吉利(Geely)、長城(Great Wall Motor)、奇瑞(Chery Automobile)及上汽(SAIC Motor)等傳統車企,以及零跑(Leapmotor)等新興品牌。
比亞迪計劃將DeepSeek技術應用於其「玄機」車載軟體平台,使旗下接近所有車型具備基本的自動駕駛功能,且不影響售價。例如,售價僅69,800元人民幣(約9,575美元)的「海鷗」掀背車,未來亦將具備AI駕駛能力。
電動滑板車企業積極跟進
在電動滑板車領域,九號公司(Ninebot,獲小米支持)與牛電科技(Niu Technologies,納斯達克上市)已紛紛採納DeepSeek技術。九號公司表示將「深度整合」AI,透過手機應用程式提供AI內容創建、數據分析、個人化推薦及智慧服務等功能。牛電科技則已自2月9日起導入DeepSeek的大型語言模型(LLM),提升騎乘安全、語音交互及智能駕駛輔助系統。全球最大電動二輪車製造商雅迪(Yadea)亦於近日宣布,將DeepSeek技術整合至其生態系統。
中國電動二輪車出口增長迅猛
DeepSeek AI的快速普及,反映了業界對該技術的高度需求。根據中國海關數據,2024年電動二輪車出口總值達58.2億美元,年增27.6%,出口量更增長47%至2,213萬輛。
IDC研究機構指出,DeepSeek的開源AI技術(DeepSeek-V3與DeepSeek-R1),因其低成本與高效能特性,促使開發者藉由GitHub等平台進行優化與安全測試,從而建立協作創新生態系統。
預計至2025年,中國約1,500萬輛汽車(佔全國銷量的三分之二)將配備初步自動駕駛系統,顯示AI技術對交通行業的深遠影響。
X(原 Twitter)近日宣布更新其社群(Communities)功能,讓社群內的貼文能夠更廣泛地在應用程式中曝光,甚至非社群成員也能夠看到這些內容。
Communities are now fully integrated across X! With this update:
👀 Community posts and replies are visible to your followers and other people on X.
🤝 Everyone on X can reply to Community posts– including non-members– but replies from Community members will be prioritized.
✏️…— Communities (@HiCommunities) February 3, 2025
主要更新內容:
✅ 社群貼文與回覆將可顯示給關注者及其他 X 用戶。
✅ 所有 X 用戶,包括非社群成員,都可以回覆社群貼文,但系統將優先顯示社群成員的回應。
✅ 社群內容將持續保留,即便該社群被刪除,使用者仍可自行刪除個人貼文。
這項改變使得社群貼文可出現在主要動態消息(main feed)及推薦內容中,從而提升觸及率,並促進更多互動。然而,此舉可能會引發隱私與社群自治管理的討論,因為原本較封閉的社群對話,現在可能被更廣泛的用戶群體參與。
X 先前已嘗試提升社群功能的重要性,例如報告顯示,社群內的使用時間在一年內增長 600%,每天約有 65 萬則社群貼文發佈。然而,X 近期又將社群標籤從應用程式底部導航欄移除,改為設立影片專用標籤,顯示社群可能並非現階段的核心發展方向。
中國芯片設計企業寒武紀科技(Cambricon Technologies)於2024年第四季度首次實現季度盈利,標誌著中美人工智慧(AI)芯片競賽進入新階段。在美國加強對中國先進半導體技術出口限制的背景下,寒武紀的成功顯得尤為重要。這家公司自2016年成立以來,經歷多年虧損,終於轉型為中國最具價值的AI公司之一,目前市值約為3000億元人民幣(約41億美元)。
儘管與美國芯片巨頭NVIDIA的3萬億美元市值相比仍有差距,寒武紀的成就顯示出中國在本土開發高端AI芯片方面的能力正在提升。寒武紀的股價在上海證券交易所科創板上大幅上漲,2024年全年增長超過470%,從每股120.80元飆升至695.96元。
技術層面上,寒武紀的7納米AI芯片及其旗艦產品寒武紀-1A處理器,已在國內市場,特別是華為等技術巨頭的產品中獲得了廣泛應用。根據預測,中國AI半導體市場到2025年將達到1780億元人民幣,寒武紀的盈利能力和市場增長潛力吸引了更多資金注入。
然而,挑戰依然存在。寒武紀需要縮小與國際競爭對手的技術差距,同時保持增長勢頭。在政府支持政策和國內需求增長的有利環境下,公司有望繼續發展。此外,中國其他科技公司,如字節跳動(ByteDance),也在加大對本地計算基礎設施的投資,表明國內市場機會不斷擴大。
在美國加州北區聯邦地方法院,Meta正面臨由作家Richard Kadrey等人提出的訴訟,指控其在開發AI模型時非法使用受版權保護的資料。原告聲稱,Meta系統性地透過torrent技術下載並移除版權管理信息(CMI),使用了包括LibGen(一個知名盜版資料庫)在內的數據集。
法庭文件顯示,Meta內部高層,包括首席執行官Mark Zuckerberg,曾批准使用這些被認定為盜版的數據集。Meta內部文件指出,LibGen被明確標註為“盜版數據集”,但相關討論仍傾向於繼續使用。此外,Meta工程師設計了程式,刻意移除版權信息以便訓練其Llama AI模型。
該案件進一步提出兩項主要法律訴求:違反《數字千年版權法案》(DMCA)及《加州綜合數據訪問與欺詐法》(CDAFA)。這些指控認為Meta的行為不僅侵犯了版權,也破壞了數據訪問的合法性。Zuckerberg本人在2024年12月的證詞中承認,這些行為“似乎是錯誤的”,但未對AI訓練行為提供具體回應。
此案凸顯了版權法與AI開發之間的矛盾,並可能為美國及全球AI相關法律的發展樹立先例。隨著生成式AI技術引發對版權保護的廣泛關注,此案的裁決將對行業未來產生深遠影響。