Google Pixel 手機已經默默走過十年光陰,當初看似實驗性質的硬體產品,如今卻已成為 Google 展示「軟硬體整合實力」的核心舞台。
Pixel 從第三代開始打出名聲,並在 Pixel 第十代再因 AI、Android 軟體以及硬體工藝的進化而再創巔峰,Google Pixel 生態系產品副總裁 Venkat Rapaka 近日在接受台灣媒體採訪時,再次闡述了 Pixel 的十年轉型之路以及未來願景。
Venkat 在 2010 年加入 Google,最初加入 Chrome OS 團隊,之後轉向 Android 部門並且透過參與 Nexus 計畫(Nexus program),最終成為 Nexus 手機團隊的一員,後續也參與了最初代 Pixel 的工作 ,並在離開團隊之後又再度參與了第 10 代 Pixel 的開發。
從 Nexus 到 Pixel 的轉型,象徵著 Google 從單純的「軟體展示者」向「垂直整合者」的關鍵戰略抉擇。
Venkat 指出,Nexus 模式本質上是與外部合作夥伴的一項「年度計畫」,這種模式存在天然的侷限性:由於硬體合作夥伴每年都在變動,Google 難以針對單一架構進行跨年度(Multi-year)的深層技術投資。
Venkat 解釋,許多新技術在轉化為產品之前,需要經過大量的研發工作。如果一個想法或技術(例如後來的 Tensor 自研晶片計畫)需要 3 到 5 年才能完成,那麼在 Nexus 這種每年更換合作夥伴、週期僅限一年的模式下,就會遇到問題,甚至無法實現。
因此,建立自家的第一方產品(First-party product)是進行這種長期佈局的唯一途徑。
「為了真正打造世界級的手機,你需要進行多年且深度的技術投資。自主研發硬體與晶片(Tensor)是極其艱巨的挑戰,這簡直是『難如登天』的事,在每年更換夥伴的循環中完全不可能實現。但唯有如此,我們才能進行長達十年的深度布局。」
而 Pixel 的核心理念,正是將 Google 最好的硬體、軟體和 AI 以一種非常緊密且連貫的方式結合在一起。要達成這種對「全端」(full stack)的掌控力,從底層的晶片(Silicon)一路到操作系統,再到上層的應用與 AI,都需要能夠預測並佈局未來數年的發展,這正是 Google 推出 Pixel 的重要驅動力。
Venkat 也在訪談中對台灣團隊給予了高度評價,並將其視為 Google 實現「全棧投資」(Full stack investment)策略的關鍵核心,例如 Tensor 晶片、台灣團隊與台積電的合作等等。
他也舉例,由於台灣團隊鄰近合作夥伴、供應商,台灣團隊能夠高效地執行產品開發,確保產品順利推出,像是 Pixel Fold 的轉軸設計、摺疊機的防水防塵能力,以及長達 10 年的耐用度標準,台灣團隊都扮演了核心角色。
Venkat 曾說,身為 PM 的最大痛苦,是他必須決定「不做什麼」,有時甚至必須忍痛割愛,某些正在開發的功能雖然令人驚艷,但當下他必須說出「還不行」的這三個字。在接受《INSIDE》採訪時,Venkat 向我們舉了個例子:「螢幕下指紋辨識」。
Venkat 透露,在開發第一代 Pixel(以及最後一款 Nexus 手機)時,團隊極度渴望實現「螢幕下指紋辨識」技術。然而當時該技術在安全性、可靠性與辨識速度上,仍無法提供完美的使用者體驗。因此,他最終決定放棄該功能,將指紋辨識器設計在手機背面。
Venkat 先前曾在 podcast 中舉了另一個例子,也就是 Pixel 10 Pro 系列此次最受討論的 「Pro Res Zoom」,也就是百倍變焦功能,他指出,在第一代 Pixel 時期「運算攝影」這個詞還很新,當時利用機器學習來超越物理光學限制(Beyond Physics)的想法簡直像科幻小說,而現在的 Pro Res Zoom 正是結合了 Google 在 Tensor 晶片、ISP(影像訊號處理器)以及 Gemini Nano 模型上多年投資的成果。
事實上,Google 已在 Pixel 上推出了 Magic Cue 這類「裝置端 AI Agent」功能(目前台灣尚未開放)。它能提供主動性與預測性的協助,不同於傳統 AI 機器人「一個口令一個動作」的模式,Magic Cue 具備環境感知能力,能辨識出使用者正在通話、查看天氣或導航,並根據情境提供特定支援。
例如,當使用者正處於壓力較大的時刻(如撥打電話給航空公司處理預訂問題),Magic Cue 能在電話接通後,預判你可能需要的資訊(如預訂代碼)並直接顯示在螢幕上。這解決了以往必須手忙腳亂切換螢幕搜尋郵件的困擾,讓資訊「就在那裡」。
Venkat 也與台灣媒體一起談到了未來的 AI 裝置以及現有 AI Agent 的問題。
現有的 AI Agent,以先前爆紅的 OpenClaw 為例,潛在的資安問題就不斷被提起,而使用者更必須為「究竟該把權限該交出去多少」負擔大部分責任,另一方面,由科技大廠開發的相關工具,往往又需要使用者一步步點按同意才會執行,那似乎不如由人類自己手動完成更快,《INSIDE》好奇:一個 AI Agent「最好的模樣」會是什麼樣子?
Venkat 向《INSIDE》坦言,這是個價值兆元的問題,也是 AI 發展中最為核心、最困難且尚未解決的矛盾:如何在賦予 AI 足夠自主權以實現自動化的同時,又能確保隱私、安全並防止對使用者造成傷害。
他舉了叫 Uber 的例子。如果 Agent 必須連續問三次:「你確定要等三分鐘嗎?」、「你確定要付 14 美元嗎?」、「確定是這間飯店嗎?」,使用者為了確認這些問題所花的精力,還不如自己動手按按鈕叫車來得快。
Venkat 認為,要解決上述問題,Agent 必須變得極度聰明,能夠在沒有明確指令的情況下做決定,這在技術上非常困難。Agent 需要學習並判斷使用者當下的優先順序(是想要省錢,還是趕時間?);當使用者說「回飯店」時,Agent 必須有 100% 的信心知道具體是哪一家飯店、不能猜錯,而這些都需要時間的累積與學習。
至於隨著 AI 發展,手機還會不會是人類最重要且普及的裝置?Venkat 認為,手機不會輕易被取代,因為它在多個維度上達到了一個難以被超越的甜蜜點。
智慧手機集結了沉浸式娛樂(螢幕夠大)、強大的運算能力(Tensor 晶片)、以及連接性(Connectivity)於一身。他類比「筆記型電腦」並沒有因為「手機」出現而消失,因為筆電更適合處理特定工作。同理,即便未來有新裝置出現,手機因其獨特的優勢仍會長期存在。
那麼,AI Agent 是否會帶領我們走向眼鏡或頭戴裝置時代?Venkat 認為這一定會發生,只是時間可能沒我們想得那麼快,像是要怎麼突破連接性、運算能力、顯示器來長時間驅動強大的 AI 與連網功能?如何突破並非每個人都喜歡佩戴眼鏡的問題?等等,他指出,未來的體驗不在於單一裝置,而在於多裝置(手錶、耳機、手機、平板)像「單一實體」般運作。Venkat 描述了一種「零摩擦 (Frictionless)」的未來,例如透過耳機與 AI 對話、用手錶遙控手機,減少掏出手機被干擾的機會。
從 Nexus 的年度實驗,到 Pixel 的十年深耕,這條路 Google 走得並不輕鬆。對其團隊而言,這場長達十年的「長遠賭注」已逐漸開花結果。當初那些看似不可能的運算攝影或自研晶片,如今已成為使用者手中習以為常的便利。這部由「看得見未來的人」所打造的手機,下一個十年會將人類帶往何處?或許答案就藏在那些「零摩擦」的無感技術中,繼續挑戰下一個不可能。
核稿編輯:Mia
加入 INSIDE 會員,獨享 INSIDE 科技趨勢電子報,點擊立刻成為會員!
延伸閱讀:
【開箱】Pixel 10 Pro XL:Pixel 3 之後的又一巔峰之作?
「來自台積電 3 奈米!」Google 團隊親自解說:Pixel 10 搭載的 Tensor G5 有多強大?


