OpenAI 正面臨其最新人工智能(AI)模型「Orion」回報遞減的挑戰,這款模型的性能提升較之前的進步幅度有所減少。根據《The Information》報導,Orion 在完成訓練的 20% 時,已達到 GPT-4 的性能水平。然而,從 GPT-4 過渡到備受期待的 GPT-5 的質量提升,未如 GPT-3 升級至 GPT-4 時那樣顯著。
OpenAI 的部分研究人員表示,Orion 雖然在自然語言處理方面表現優越,但在程式編碼等任務上,並未明顯超越其前代模型。這一現象反映了 AI 訓練的初期階段通常能帶來最大幅度的改善,而隨後的階段則往往會呈現回報遞減的現象。因此,即便剩餘的 80% 訓練完成,也不太可能達到與過去相同的突破性進展。
這個情況正值 OpenAI 面臨重大挑戰之際。該公司最近完成了一輪融資,籌得 66 億美元,這使得投資者對其期望大幅提高。然而,AI 開發中傳統的擴展方法正變得越來越困難,技術挑戰也在加劇。如果新模型未能達到預期,OpenAI 可能在未來的融資中難以吸引同樣高的投資興趣。
此外,AI 領域正面臨高質量訓練數據日益稀缺的問題。根據一篇於 2024 年 6 月發表的研究報告,AI 公司可能會在 2026 到 2032 年之間耗盡可用的公開人類生成文本數據。業界人士指出,開發者已經「充分榨取」了這些數據,未來的 AI 發展將面臨更嚴峻的挑戰。
為應對這些問題,OpenAI 正在重新思考其 AI 發展策略,並逐步將重心轉向模型初步訓練後的改進,以突破傳統的擴展法則。然而,該公司近期的多名高層人員離職,將進一步增加其發展的不確定性。
隨著特朗普(Donald Trump)即將重返白宮,社交媒體平台將面臨何種影響成為關注的焦點。根據特朗普在競選期間的言論,各大平台可能會在未來四年內經歷不同的挑戰與機遇。
Meta
特朗普與Meta(前稱Facebook)的關係複雜。他曾在過去花費數百萬美元投放Facebook廣告推廣競選活動,但也指責該平台審查其內容並限制其影響力。川普曾多次警告扎克伯格(Mark Zuckerberg)不要干涉2024年的選舉,甚至威脅將其終身監禁。儘管Meta試圖遠離政治內容以避免爭議,但川普對該公司的不滿可能會帶來負面影響。不過,川普推動美國人工智慧(AI)創新,並計劃取消拜登政府的AI監管行政命令,這或許將使Meta受益,特別是在AI技術的應用方面。
X(Twitter)
X(前稱Twitter)可能是特朗普第二任期的最大受益者。平台所有者馬斯克(Elon Musk)在協助川普競選中發揮了重要作用,並利用平台推廣關鍵信息。川普在勝選演講中稱讚馬斯克為「超級天才」,並在共和黨中崛起。兩者的合作關係可能會帶來更多廣告商的支持,甚至可能將X轉變為一個更有吸引力的廣告平台。儘管兩人的合作可能面臨挑戰,但目前X似乎迎來了新的機會。
TikTok
特朗普曾於2020年提議禁止TikTok,但如今他承諾拯救該應用,避免其被美國禁止。然而,儘管特朗普有意推動TikTok的存續,拜登政府已簽署法案,要求TikTok出售其美國業務。因此,特朗普在此問題上的行動空間有限,可能無法完全扭轉局勢。
Snapchat與LinkedIn
Snapchat和LinkedIn在川普競選中並未成為焦點,但他的政策可能會間接影響這些平台。特別是,針對AI監管的放鬆可能使LinkedIn受益,因為其母公司微軟(Microsoft)在AI技術上有重大投資。然而,由於Snap的硬件生產依賴中國,川普的「美國優先」政策可能會對該平台產生潛在的負面影響。
總結
特朗普的第二任期可能對各大社交媒體平台帶來深遠的影響。Meta和X可能在AI創新和政策放鬆方面受益,而TikTok則面臨持續的生存挑戰。香港特區政府可關注美國在AI和科技監管方面的動向,推動本地科技創新,並與國際平台合作,加強數字經濟的發展。
隨著特朗普(Donald Trump)在2024年再次當選美國總統,這是否意味著TikTok的出售法案將被撤回,而TikTok可以繼續在美國運營?
在競選過程中,特朗普多次承諾,如果他重返白宮,他將「拯救TikTok」,同時強調自己已經成為該應用中的「大明星」。此舉被視為拉攏年輕選民的策略,或許也幫助他贏得了一些選票。然而,如果特朗普真的想讓該平台繼續在美國運營,他可能面臨一些艱難的決策。
需要澄清的是,現行的TikTok出售法案並不會直接禁止該應用在美國運營,但它要求TikTok必須轉為美國所有,才能繼續在該地區運營。中國政府已表示將反對這項法案,並抵制任何強迫中國企業轉為美國所有的行為。這種情況可能導致TikTok被迫退出美國市場,但技術上來說,這並不是一個直接的禁令。
特朗普已經利用TikTok出售問題作為拉票策略之一。現在,我們要觀察他是否真的會撤回這項法案,該法案已經獲得美國參議院的批准。
作為總統,特朗普完全有能力撤銷這項法案,從而推翻參議院的決定。然而,這將顯著削弱參議院的權威,因此他是否願意這麼做還不清楚。
儘管如此,特朗普當選對TikTok管理層來說無疑是個好消息。TikTok已經對美國政府提起了昂貴的法律訴訟,以反對這項法案。如今,該平台繼續留在美國市場的前景變得更加光明。
然而,我們不能忘記,特朗普早在2020年就曾提議禁止TikTok,但當時他的理由與現在的網絡安全問題不同。當時,由於新冠疫情的爆發,特朗普指責中國,並誓言禁止TikTok作為對中國的懲罰。因此,特朗普當時並不是出於對中國政府間諜行為的擔憂,而是出於個人和外交原因攻擊該應用。
如今,特朗普似乎已經原諒了TikTok,並利用這個平台與年輕選民建立聯繫。這讓他的態度有所轉變。
總的來說,目前還無法確定特朗普對該平台的具體看法,或者美國頂尖的網絡安全專家是否能像影響參議院一樣影響他的決策。也許在交接簡報中,特朗普會被說服繼續推行TikTok禁令。不過,對TikTok來說,現在是一個重新游說並爭取留在美國市場的機會。
特朗普正式就任還有一段時間,但TikTok未來的前景確實變得更加光明。
Meta 已宣布將其針對選舉相關廣告的限制期延長至美國選舉結束後,因預期此次選舉計票過程可能會持續較長時間且具有分裂性。Meta 原定的選舉廣告封鎖期為 2024 年 10 月 29 日至 11 月 5 日,但現在已將此限制期延長至未定的時間,以減少潛在的社會擔憂。
根據 Meta 的聲明:
“The restriction period for ads about social issues, elections or politics is being extended until later this week. As a reminder, ads that have run prior to 12:01 AM PT on October 29, 2024 and served at least one impression will be allowed to continue while the restriction period is in effect with limited editing capabilities.”
Meta 使用了不確定的「until later this week」作為延長期,並表示會根據選舉結果來決定對公民參與的影響。2020 年的選舉曾經出現過選票舞弊的指控,這些指控一直延續至總統就職日,甚至引發了暴力事件。考慮到這一點,Meta 希望確保自己不會助長類似事件,因此決定進一步擴展這次的選舉廣告限制期。
對於一般廣告商來說,這一決定影響不大,這反而可能為其他廣告提供更多展示機會。但由於選舉焦慮,這些廣告的效果可能會受到影響。對於政治廣告商來說,這意味著其策略可能需要重新調整,但大多數政治廣告活動可能已經暫停,直至選舉結果明朗為止。
Meta 將在本週晚些時候提供進一步更新,說明政治廣告封鎖的具體情況。
X(前稱Twitter)正在推動一項新舉措,以加快「社群註解」(Community Notes)在應用程式中顯示的速度。這個新計劃名為「閃電註解」(Lightning Notes),並已進行測試。在某些情況下,註解在撰寫後不到15分鐘內便可顯示於相關帖子上。
X官方解釋道:「我們重構了系統,使註解評分速度加快。自實施以來,我們看到註解在撰寫後最短14分33秒內即可上線,且在帖子發布後18分20秒內顯示。」相較於以往,註解通常需要一小時或更長時間才能出現在帖子上。
整個流程如下:
- 用戶點擊帖子右上角三點選單中的「請求社群註解」選項。
- 社群註解貢獻者組收到通知,開始審查該帖子。
- 經認證的貢獻者檢查準確性並提交相關註解。
- 註解會由另一位來自不同政治立場的貢獻者審查,最後決定是否顯示於帖子上。
這一新系統顯著縮短了註解顯示的時間,但要在廣泛範圍內實現此速度仍具挑戰。考慮到X平台上有80萬名註解貢獻者,每天處理數百萬個帖子,實際上讓所有註解都能在幾分鐘內顯示並不現實。然而,X表示,任何在發布後一小時內顯示的註解將帶有閃電標誌,以彰顯其快速處理。
研究表明,註解顯示得越快,越能有效降低錯誤資訊的影響。然而,即使是一小時的時間,也可能讓錯誤資訊造成重大影響。再加上有些大V(影響力用戶)會將錯誤訊息傳播給數億用戶,半小時的延遲在某些情況下還是過長。因此,社群註解雖是減少錯誤資訊的有效工具,但並不足以完全依賴該系統作為主要的內容審核方式。
儘管如此,X平台繼續改進該系統,現已包括「回溯通知」,提醒用戶曾互動過的帖子若新增了註解。更快的註解顯示是一項重要進步,但系統本身仍有其限制,這些因素可能削弱其實際效用。
隨著社交媒體的快速發展,品牌與網紅合作已成為推廣產品和服務的重要策略。然而,這類合作也伴隨著高風險。許多網紅為了博取眼球,時常製造爭議,這可能對合作品牌造成負面影響。為此,品牌必須對潛在合作對象進行深入的背景調查,而這一過程往往耗時費力。
Lightricks 公司近期推出的 AI 工具 SafeCollab,旨在解決這一問題。作為其 Popular Pays 創作者合作平台的一部分,SafeCollab 通過人工智慧技術,幫助品牌自動化審查網紅背景。這一工具運用了大型語言模型(LLMs),能夠在短短幾分鐘內分析網紅在 Instagram、TikTok 和 YouTube 等多個社交平台上的過去內容,並進行風險評估,確保其形象與品牌價值觀一致。
傳統上,品牌營銷團隊需要花費數小時檢查網紅的歷史內容,這是一個繁瑣的過程。而 SafeCollab 不僅能縮短這一過程,還能在合作期間進行實時監控,及時發出警報,避免因網紅發布不當內容而造成的品牌危機。
一個典型案例是網紅 Brooke Schofield 與服裝品牌 Boys Lie 的合作。本看似理想的合作卻因 Schofield 早年的種族歧視言論曝光而告終。若當時有 SafeCollab 這類工具,品牌方本可提前發現這些問題並避免損失。
總結來說,SafeCollab 透過自動化的審查功能,大大降低了品牌合作中的風險,使品牌能夠更安全、高效地選擇網紅合作夥伴。
為了加速公司在人工智能(AI)領域的發展,Google 執行長 Sundar Pichai 最近宣布了一系列結構調整和領導層任命。
此次重組將由 Sissie Hsiao 領導的 Gemini 應用團隊併入 Google DeepMind,後者由 Demis Hassabis 領導。Pichai 解釋說:「將這些團隊緊密結合,能夠改善反饋循環,快速部署新模型,並提升我們在 Gemini 應用的開發效率,進一步強化產品的勢頭。」
此外,Assistant 團隊將專注於設備和家庭體驗,並整合至平台與設備部門,這一舉措旨在使這些團隊與它們所開發的產品更緊密對接,同時統一 Google 智能家居的 AI 戰略。
擁有 12 年 Google 工作經驗的 Prabhakar Raghavan,將從現任職位轉任 Google 首席技術官(Chief Technologist)。Pichai 表揚了 Raghavan 的領導能力,尤其是在 Gmail 團隊的領導下推出了「智能回覆」(Smart Reply)和「智能撰寫」(Smart Compose)等早期 AI 應用,成功將 Gmail 和 Google Drive 用戶數提升至十億人次以上。
K&I(知識與信息)部門將由 Google 長期員工 Nick Fox 接管,他曾參與多個產品領域的開發,包括搜尋、Assistant、購物、旅遊及支付產品。Pichai 表示,Fox 在制定 Google AI 產品路線圖上發揮了關鍵作用,並經常承擔公司最具挑戰性的產品問題。
此次重組正值 Google 在 AI 領域推出多項創新之際,這些創新包括 NotebookLM 的音頻概要(Audio Overviews)、搜尋和 Lens 的信息發現功能增強、新版 Google 購物平台的推出,以及新的 Gemini 模型家族的進展。此外,Google 在醫療 AI 領域也取得了重要里程碑,其糖尿病視網膜病變檢測系統已在印度和泰國完成了 60 萬次篩查。
Pichai 強調:「AI 的發展速度遠超以往任何科技。為了保持這種發展勢頭,我們正進行結構簡化,以加快進展。」
YouTube最近宣布了一系列新功能,包括更新頻道會員徽章、付費產品置入選項,並對Shorts(短片)草稿的呈現方式進行了變更。
首先,YouTube澄清了有關Shorts的變更。YouTube此前宣佈,所有長度在三分鐘以內的影片都將歸類為Shorts,這引發了不少創作者的困惑。為此,YouTube進一步解釋說:「2024年10月15日前上傳的3分鐘或更短的垂直影片仍將保持為VOD(隨選視訊)或長篇影片。不會自動將之前上傳的影片轉為Shorts,只有在今日之後上傳的0至3分鐘的方形或更高比例的影片才會被視為Shorts。」
這意味著,過去上傳的影片不會受到影響,只有新的短片上傳才會被標記為Shorts。YouTube還指出,系統需要數週時間來適應這一變更,因此,如果創作者上傳超過60秒的影片,它仍會暫時顯示為長篇影片,並可進行推薦。未來幾週內,這些影片將逐漸轉為Shorts,並顯示在頻道頁面的Shorts標籤下。
此外,YouTube還允許創作者在YouTube應用中更改Shorts的縮略圖畫面,並在Studio桌面和移動版中擴展了自定義會員徽章的上傳功能。創作者現在可以在上傳過程中更輕鬆地添加會員徽章和表情符號。
在贊助內容標籤方面,YouTube也做出了改進。創作者無論是在移動端還是網頁端,現在都可以更方便地標註短片或長片為贊助內容。此外,YouTube還擴展了Shorts草稿功能,允許創作者在Android和iOS平台上查看、編輯或刪除多個草稿。
這些更新雖然不大,但都為創作者提供了更靈活的管理工具,無論是在桌面端還是移動端,都能更好地管理內容。
根據SponsorUnited發佈的最新研究,新興品牌正積極尋求與網紅(influencers)及名人(celebrities)合作進行代言活動。在過去12個月內,進入代言市場的品牌中,有29%是首次參與此類合作。然而,這些新進品牌中,僅4%進行了多次代言合作,大多數品牌選擇僅與一位名人或網紅合作。
首次參與代言合作的品牌主要來自消費品、食品和服裝配飾類別,這三大類別佔所有新進品牌的38%。SponsorUnited的《2024名人與網紅報告》分析了650多個品牌和1350筆代言合作,並評估了2023年9月3日至2024年9月2日間發布的3000篇名人和網紅相關的社交媒體帖文。
在整體代言市場中,化妝品和護膚品牌是最活躍的參與者,擁有68份代言合作,成為最大的分類。緊隨其後的是非運動類服裝和鞋類品牌,擁有62份代言合作。L’Oréal(歐萊雅)和沃爾瑪(Walmart)各自擁有六個代言合作,成為代言市場的領導品牌;亞馬遜Prime(Amazon Prime)和Airbnb則各自擁有五個代言合作,緊隨其後。
傳統名人依然擁有很強的影響力,但網紅的影響力正在增長。報告顯示,過去12個月內,全球前100名名人和網紅的新增粉絲數達到9.18億,其中超過70%的粉絲增長來自於網紅。這一趨勢主要受益於YouTube的影響。知名網紅Jimmy “MrBeast” Donaldson的粉絲數在過去一年增加了1.82億,使他成為增長最快的網紅。而在名人中,意大利體育記者Fabrizio Romano的粉絲增長最多,達到2200萬。
在這些代言合作中,年齡在25至44歲之間的名人和網紅最為成功,這一年齡段佔據了總代言數的58%。性別方面,男女代言合作數量相對平均,女性佔48%,男性佔52%。在平台受歡迎程度上,名人的粉絲主要來自Instagram(61%),而網紅的粉絲則集中於視頻平台,特別是TikTok(36%)和YouTube(34%)。
該研究表明,名人和網紅的代言合作已成為品牌推廣的重要策略,尤其是網紅在YouTube和TikTok等視頻平台上的影響力迅速增長。香港特區政府應考慮推動本地品牌與網紅合作,尤其是在視頻平台上,從而提升品牌知名度和國際影響力,促進本地及國際市場的品牌發展。
Galileo,作為業界領先的企業級生成式AI解決方案供應商,近日發佈了最新的 「幻覺指數」(Hallucination Index)。
本次評估框架,聚焦于檢索增強生成(RAG)技術,對OpenAI、Anthropic、Google及Meta等在內的22個主流生成式AI大型語言模型(LLM),進行了全面剖析。與去年相比,今年的「幻覺指數」顯著擴容,新增了11個模型,反映出了過去八個月間,開源與閉源LLM領域的蓬勃發展與快速增長態勢。
Galileo CEO兼聯合創始人Vikram Chatterji指出「在日新月異的AI領域,開發者與企業正面臨一項重大挑戰:如何有效利用生成式AI的強大功能,同時兼顧成本效益、精准度與可靠性。遺憾的是,當前的評估基準多以學術場景為基礎,而非現實世界的應用需求。」
Galileo採用的「幻覺指數」,引入了上下文依從性(context adherence)這一核心評估指標,該指標通過檢驗模型在不同輸入長度(從1,000到100,000個上下文詞匯)下,所出現的輸出不準確性。此評估方法旨在為企業提供寶貴的洞見,助力其在AI部署過程中,就成本效益與性能表現之間,做出更加明智的權衡決策。
該指數的主要發現成果包括:
- Anthropic的Claude 3.5 Sonnet整體表現最佳,無論是在短、中還是長文本場景中,都表現穩定,近乎完美。
- Google 的 Gemini 1.5 Flash 在成本效益方面表現最佳,在各類任務中表現優異。
- 阿裡巴巴 的 通義千問Qwen2-72B-Instruct, 以表現最佳的開源模型脫穎而出,特別是在短至中長度文本場景中,表現卓越。
該指數還揭示了LLM領域的幾大顯著趨勢:
- 開源模型正在快速縮小與閉源模型間的差距,以更低的成本提供優化的「幻覺」處理能力。
- 當前的 RAG LLM ,在處理擴展上下文長度方面,得到了顯著改進,不僅保持了高質量輸出,還確保了準確性。
- 輕量模型憑藉高效設計策略,在某些場景下反而能超越大型模型,證明了在LLM領域,智慧設計往往比單純追求規模更為重要。
- 值得注意的是,來自美國以外的優秀競爭者,如Mistral的Mistral-large及阿裡巴巴的Qwen2-72B-Instruct等,紛紛嶄露頭角,彰顯了全球範圍內LLM開發競爭的日益白熱化。
結語
隨著AI行業不斷努力攻克生成式AI產品中出現的幻覺問題,Galileo推出的「幻覺指數」,能夠讓企業在特定需求與預算的限制下,找到合適的模型,為他們提供極具價值的指引與洞見。同時,還反映出技術的發展不僅僅依賴於規模,更強調設計的智慧和成本效益的平衡。此外,全球範圍內的競爭加劇,也意味著未來會有更多創新和優化的AI模型湧現。