以鋪牀對抗 AI

最近早起開始鋪牀。說來可笑,如此小事,我是去年看到赤峰幸生提及才開始實踐。我想成爲時尚的人,但很不喜歡買衣服,那麼至少可以做一些其它赤峰幸生在做的事,比如鋪牀。

鋪牀可以對抗 AI,因爲這件事 AI 沒法幫妳做。如果妳不做任何 AI 沒法幫妳做的事,就意味着妳做的事全都是 AI 可以幫妳做的,於是妳就什麼都不必做了。AI 沒法幫妳做的事做得越多,生活就越不可能被 AI 取代。

點此讀豎排版)

簡單而困難的任務

過去人們以爲藍領工作最易被機器取代,白領可以安枕無憂。但直到目前爲止,機器依然沒有取代卡車司機,倒是不少辦公室文員工作被 Excel 取代了。同樣,LLM 如今已經能做很多事,但昨日爲了把六頁這樣的日文列表翻譯並整理成這樣的英文版,在 ChatGPT 的幫助下我依然花了兩個多小時。遇到的具體問題如下:

一、無論 ChatGPT 還是 DeepSeek 都無法自動識別那些圖片,說無法解析版式。於是我只能用 iOS 和 macOS 自帶的文字識別功能把裏面的文字手動拷貝出來,再丟給 LLM 翻譯。爲了在這一步儘可能保證準確,我是一年一年地拷貝,而非一整頁全選;

二、ChatGPT 的翻譯能力應該說已經相當夠格。拷出來的文字時有舛誤,例如「山田和樹指揮読売日本交響楽団」被識別爲「山田和 指 売日本交醬染」,但 ChatGPT 也能猜中意思並給出正確譯文。不過日文原版會把例如蕭邦夜曲 Op. 48, No. 1 植爲「Op. 48-1」,不合英文體例,需要手動校正。固然這只是簡單的全文替換操作,但必須人工審校整份列表之後才會知道有哪些類似的情況需要替換;

三、這張列表不算短,但我也萬萬沒想到這種長度能讓 ChatGPT 卡住。我把初步整理和校對完畢的整份英文列表發給它,請它幫忙轉爲 Markdown 格式。但它每次都在三分之一處停了下來,給出一句「接下來的內容會繼續以此格式進行」了事(!),屢試不爽。最後我只能把列表切成幾段,分段請它清理;

四、曲目名稱相對簡單,在英文裏都有通用寫法,但遍佈日本的各演出場地名是否有固定英文名稱,若無,是應該直接以羅馬字拼出日文讀音(例如東京文化會館 >> Tokyo Bunka Kaikan)還是自行譯爲英文,則是需要參考過往慣例和常識來決定的事,並不總有標準答案。換言之,是百分百的人工作業;

五、最後要將所有曲目名稱改爲斜體。這裏也有一些例外情況。例如蕭邦的 Op. 59 由三首馬祖卡構成,在曲目單裏被寫爲「Three Mazurkas, Op. 59」。這裏的 three 一詞並非曲目名稱的一部分,故不應斜體。我給出的指令如下:

Please add underlines around work titles below (i.e., the Markdown syntax for italics), but only around work titles. If an adjacent word is not part of the work title, please don’t italicize it.

結果 ChatGPT 和 DeepSeek 都依然把 three 變成了斜體。簡單來說,LLM 給出的 Markdown 文檔依然需要從頭到尾審校一遍。

或許我的用法不對,但老實說這次經歷並不讓我意外。許多沒有標準答案、需要判斷力的任務看上去微不足道,但都會讓 LLM 卻步。或許這算是 LLM 的一種 humility,未嘗不是好事。而我們的社會是否重視這些任務,決定了我們會生活在什麼樣的社會。

點此讀豎排版)

對我來說,老人的話的價值並不在於經驗或智慧,而是因爲她們是被和現在完全不一樣的世界塑造的。這也是爲什麼中華人民共和國的老人的話沒有必要聽,因爲她們生活的中國和現在的中國沒有本質區別。

點此讀豎排版)

這個故事的諷刺之處在於,儘管 Hudhayfa Nazoordeen 在 Claude 等工具的幫助下從零開始搭出了一台核聚變裝置,但最後還得收拾提前離開的室友們留下的啤酒罐,而這件事 Claude 恐怕幫不了他什麼——聽說 AI 可以把人類從雜務中解放出來去做更有創造性的事?等到 AI 能幫我收拾垃圾的那天,它也能把我從創造中解放。

點此讀豎排版)

過去幾天試用以及看別人試用 DeepSeek 的感受是,如果我們把 LLM 視爲另一種整理和呈現人類知識的媒介,那麼 DeepSeek 的惡質可謂一目瞭然。它從娘胎裏就自帶完整的言論審查機制,而且剛出生不久用戶就遍佈全球。中國人曾經能用穀歌,而外國人至今也不怎麼用百度。DeepSeek 如今還是個嬰兒,其呈現自我審查的方式有時難免令人啼笑皆非。可以想像,假以時日,它的設計會更加成熟完善,沒有人會意識到它有在審查言論,而這種思想上的自宮也絕不可能僅僅是對於某些特定的話題避而不談。

點此讀豎排版)

DeepSeek 更懂中文?

有此一說。初步測試後,我也同意。先問了這個問題:

我記得網上流傳過一份張愛玲手寫的快遞單,現在找不到了,你有印象嗎?

這指的是本站的這篇文章。如果有人之前看過,可能會發現標題「張愛玲的快遞單」變成了「張愛玲的傳真」,內文亦有修改。這是因爲 DeepSeek 指出張愛玲活動的「二十世紀中葉」還沒有快遞單這個概念,不能排除惡搞或僞造的可能。這份傳真是一九九三年發出,但它確實不是快遞單。DeepSeek 助我反省。(ChatGPT、Claude、Perplexity 都沒有提到這點。)

第二個問題是:

近年經常聽到人們在日常對話裡用「大概率」一詞,你怎麼看?

DeepSeek 給出的反饋非常全面,不過文字很像中國官方傳媒的口吻。例如結語部分:

「大概率」的流行是語言與社會互動的自然結果,它既反映了公眾科學素養的提升,也暗示了現代社會對「不確定性管理」的集體焦慮。語言如水,終將找到動態平衡——當某個詞彙的濫用突破實用邊界時,自會有新的表達替代其功能。重要的是在使用中保持清醒:術語是思維的腳手架,而非思想的遮羞布。

對比人民網研究院周春媚的「逃离『信息茧房』与『技术黑箱』」一文:

去年,《人民日報》曾經撰文提醒新聞不可被算法、流量和點擊量「綁架」,後又再次發文稱不能讓算法決定內容。然而也正如文章所說,我們「不可成為算法和技術的奴隸」,也無法「對算法和技術視而不見」(呂洪,2017)。克蘭茲伯格三十年前的定律便告訴我們,技術無分好壞,也從不中立,決定技術將人類帶向何方的方向盤,歸根結底還是握在人類的手上。因此,對於風險社會中的算法技術,我們不妨抱著謹慎樂觀的態度,化解算法所陷的新聞倫理困境,打破禁錮人類的信息繭房與技術黑箱。

ChatGPT、Claude、Perplexity 的答案均無此風,但對於大概率一詞的分析和梳理也遠不如 DeepSeek 詳盡。

至於「更懂中文」意味着什麼,就是另一個問題了。

點此讀豎排版)

看到有人用這種方式繞開 DeepSeek 的言論審查,想起十多年前,有人用豎排之類的花招做類似的事,之後就是隱語遍地的世界。而這位老兄的回應很對,只不過對於中國人實在是老調了。

蘋果中國的播客審查

某種意義上說,蘋果中國的播客審查比中國政府主導的所謂「Great Firewall」(GFW)更加麻煩。事到如今,在手機和電腦上安裝 VPN 或其它軟件來突破 GFW 已經算是大家相對熟悉的操作,有些人還會想辦法購買香港等地的 SIM 卡在中國用。與之相比,註冊非中國區 Apple Account 是更大的障礙。生活在中國的人有各種理由不得不用中國區帳號,而在兩國帳號之間反覆切換會影響到蘋果的一系列服務,體驗實在不能算愉快。

目前在中國的狀況是:

  • GFW 的審查:使用外國 Apple Account 但並未「翻牆」的情況下,也有很多外國播客搜不到,例如 BBC 的 Global News Podcast,當然也包括使用外國播客工具上線的華文播客;
  • 蘋果中國的審查:使用中國 Apple Account,那麼無論是否「翻牆」都搜不到外國節目——除非節目製作方通過中國播客平台再單獨提交給蘋果中國,接受審查後方可上線;(我未曾通過中國播客平台提交。如果妳能在中國區搜到《一天世界》播客,大概只是因爲我們上線較早。)
  • 直接在蘋果 Podcasts 裏搜索節目的 RSS 地址能否訂閱?我只能說沒有人能確定。

要言之,蘋果的 iTunes 作爲事實上的中心化全球播客分發機制,已經完全暴露了中心化的弱點。反而在 Android 上由於可以隨意安裝軟件,大體可以確定只要繞開了 GFW,輸入節目的 RSS 總是可以訂的——前提是這條 RSS 的域名歸作者而非中國播客平台如小宇宙、喜馬拉雅所有。至於 iOS,目前看來瑞士出品的新版 Reeder 是一個在技術倫理上說得過去的方案。它有單獨的播客分類。只要節目有獨立 RSS 即可訂閱收聽,也支持後台播放。目力所及,內容簡介的版式也保持得不錯。今年將要上線的 Tapestry 想必也是如此。

點此讀豎排版)

阿酌

前幾天小宇宙推出了會員計劃,裡面有一項功能是會員可以獲得播客節目的 AI 總結。原本我沒有注意到這件事情,直到發現有友鄰提出了主播關於內容版權的疑慮以及後台操作關閉 AI 總結功能的各種不便,比如主播竟然不能一鍵選擇關閉 AI 總結功能,必須要自己進入後台點擊單集的編輯功能進行重復操作。

(比如我們目前有 89 個單集,也就是說,如果我要關閉 AI 總結的功能,我需要登錄後台,依次進入每個單集,進行「編輯-不允許總結-完成」這個操作 89 次!)

於是也去聯繫了小宇宙的客服提出了這些疑問,比如「為什麼主播作為內容創作者要額外增加這麼多的機械勞動?」「我們創作的內容會被當成訓練 AI 數據的樣本嗎?」這些問題都沒有得到回復,很快也沒有人再討論這些事情。

對於自己的文章有可能被當作 LLM 的訓練樣本,我還沒有想通應該如何看待。但刻意爲用戶製造不便,半強制地逼迫作者接受某個功能,則無疑是糟糕的軟件設計。小宇宙想必也知道這點。或許她們有身不由己之處,但這依然是在消耗一個原本花了心思設計的軟件。

點此讀豎排版)