網站演義

每隔幾年,總會打理網站一次,主要原因是博客技術日新月異,要加上某項新功能,難免要追索十幾年以來的每一篇文章,圖書館術語稱之為回溯性標準轉換﹝Retrospective Conversion﹞,是業界一項十年一遇的大工程(見《圖書館的故事》)。當然,敝網比不上百萬藏書的圖書館,但積存下來的資料已足夠累人。大約在 2009 年起,wchu.com 逐步分拆出文字博客的 cchu.com 及行山日誌 hiking100fun.com,而 wchu.com 則以相簿為主。wchu.com 現有 328 篇博文及超過 9500 幅相片,cchu.com 則有 445 篇博文,而 hiking100fun 也有約 100 篇日誌。

網站除了是相簿、原稿紙及報名行山的地方1外,其實也是練習網頁程式的地方。最初每頁是獨立的 html 檔,在 frontpage 裡頭有個 template 可以重覆使用。後來在 2003 年起採用 mysql 的 content management 模式,令貼文更加方便之餘,日後改版更加簡便,那是網站的第一次 Retrospective Conversion。這個模式維持了許多年,直至 2009 年認真考慮 wordpress 界面(見《新版與四位朋友》),並分拆出 cchu.com。那時網站已累積了三百多篇文章,除了要從新把文章輸入至 wordpress 平台外,還要為每篇文章分類及加標簽,這應該是網站的第二次 Retrospective Conversion。

第三次 Retrospective Conversion 是 2012 至 2013 年,因為 nextgen gallery 興起,便放棄舊有的自製相薄平台。在此之前,重組了 wchu.com 的行山網及 hiking100fun.com,順道試驗 wordpress + nextgen 的平台,試用滿意後便計劃把 wchu.com 搬到 wordpress 的平台上。這個轉換工程除了要為每篇博文配上分類及標簽外,還要把幾千幅照片從新上傳到 nextgen 系統,也要替每幅照片上的親友加標簽,這個轉換過程前後花了幾個月,實在省不了時間。

現時正計劃第四次 Retrospective Conversion,原因是 wordpress 愈來愈流行主題圖片(Featured Image),現時許多新的 wordpress 版面都以主題圖片設計為中心,韋信為跟上潮流,不得不為 wchu.com 及 hiking100fun.com 四百多篇博文加上主題圖片,尤幸是次轉換(嚴格來說只是附加功能)不會太花時間。

1. hiking100fun 或 wchu.com 的行山頁面一直是相約友人行山的地方,行山朋友可以定期到網頁查詢,通常會在一至兩星期前貼出行山路線、集合地點及一切相關資料。到後來 hiking100fun 時候更用來作行山報名網站,所以裡頭的資料(除相片外)都不是原創的,因為寫的時候仍未上山,一切資料都是從網上找來的。

這是我替 Joan 新成立的網站,就是以主題照片設計為主的版面。
這是我替 Joan 新成立的網站,就是以主題照片設計為主的版面。

445

氣象預測

颱風鮎魚跟香港擦身而過,切合一句中國人的比喻『雷聲大雨點小』。的而且確,鮎魚初期來勢洶洶,挾著南中國海二十年來最猛的超級颱風之名而來,最終卻沒下過一場大雨便走了。一些無知巿民指責天文台『亂點』,打亂了他們的周末計劃云云。我本身不是一位追風者,但卻明白氣象預測的難處,所謂天有不測之風雲,要預測天氣,比預測女人的心理更困難。以龍捲風為例,美國氣象局只能在龍捲風形成二十分鐘前才能夠偵測到,氣象學家一直希望可以更早向市民提供預警,但奈何以現今的科學技術仍未能辦到。

要了解氣象預測,先要了解整個氣象系統,什麼高壓脊、高壓區、低壓區、冷鋒、暖鋒、海洋溫度、海洋氣流等等。颱風預測的氣象圖,需要覆蓋從內陸至南中國海至西太平洋,當中所包含的數據既多亦繁複,然而數據愈多及愈仔細,所得出來的預測亦愈準確。今天的氣象預測均依賴超級電腦,把所有氣象資料輸入電腦運算,再分析出颱風的位置及要走的方向。現代的颱風路線預測全賴模擬器技術,要預測精確的路線,需要依據今天的數據去模擬明天的氣象形勢,再依據『估計的』明天氣象形勢去再模擬後天的氣象形勢,如此類推。

自從 1997 年深藍電腦打敗國際象棋冠軍卡斯巴羅夫後,人工智慧在某程度上來說,已經可以取代人類智慧,甚至超越人類,尤其對於處理龐大的數據分析及預測,但仍然要面對一個難題:時間。在棋賽上,卡斯巴羅夫可以等深藍運算後再下棋,過程中,橫盤上的形勢不會改動,但現實世界卻是瞬息萬變的,地球總不能停轉二十分鐘來等電腦去運算。所以說,氣象預測一定要快,而且資料必須是最新及最準碓,甚至可能要每分每秒去更新氣象資料,氣象電腦總不能花二十分鐘去運算龍捲風的預測,否則龍捲風形成後才發預警便沒意思了。

412

虛擬系統與未來戰士

在電影《未來戰士》中大隻佬明星阿諾舒華辛力加飾演的機械人 T800 來自未來世界,奉命謀殺未來人類軍隊領袖的父親米高·比恩。然而,整件事件的源頭始於美國國防部一部超級電腦 — Skynet,設計原意是當國家受外來襲擊時,電腦可以全權控制所有導彈、人造衛星等軍事設施,並自動作出防衛。後來,Skynet 背叛了人類,展開了一場人類與電腦的戰爭。

《未來戰士》跟一般的科幻故事一樣,大家都在猜想,到故事發生的時代,這樣的情況會否發生呢?小叮噹會否在廿二世紀出現?2012 時地球會否遇上大災難?2001、2010 會否像寇比力克所預言的一樣?在最近的一次學術會議中,有學者談及虛擬系統﹝Virtual Machine﹞的發展,聽罷,我跟身邊的朋友低聲細語:這不是跟《未來戰士》的 Skynet 一樣嗎?

虛擬系統是一套可以模擬硬體的純軟體系統,簡單來說,是在一部電腦裡頭建立另一套虛擬電腦,而兩套系統可以完全獨立運作而不會互相干擾。虛擬系統的發明源自兩派,一派是仿真器﹝emulator﹞的出現,例如在 Windows 系統下仿造一台任天堂遊戲機,令老鬼可以重溫年少時的經典遊戲;另一派是給電腦初學者提供一個廉價的實習平台,用家可以在 Windows 系統下建立一台 Unix、Linux、Oracle 等高檔次的伺服器,而又不用購買昂貴的器材;再者,搞垮了,只要在系統上把虛擬器刪掉、再建立便成。後來,虛擬系統逐步應用到實用的層面,例如可以在 Mac 系統下運行 MS Windows、在 Windows 7 下運行 Windows XP 等等。

在伺服器上應用虛擬系統是近年談論得最熱烈的話題,虛擬系統的優點,是掛上的伺服器不用考慮硬體價錢及存放空間的問題。更重要的是搬遷或複製伺服器所需工序大大地簡化了,理論上,只要複製某個虛擬伺服器的系統檔便可以了。如是者,有學者研究了一類人工智慧系統,如發現某﹝實體﹞伺服器出現問題,可以自動把所有虛擬系統搬到另一台伺服器上。這不就是 Skynet 的原型嗎?就以敝校為例,假如該人工智慧系統背叛了人類的話,它可以輕易調動警隊、消防隊及醫療隊,因為警報系統連上了警局、消防局及報案中心。也可以經 IP 電話連到北韓國防部,說美國要跟他開戰,再發一通受襲警怖給美國的國防系統。你會說,索性拔掉電源不行嗎?不行,因為敝校的門禁系統﹝Access Control System﹞也由伺服器管理;你又會問,那麼關掉整區的電源不就行嗎?不行,因為敝校的聯營網絡系統遍佈全港十八區,它可以不用五分鐘把伺服器由灣仔『搬』到東涌,甚至搬到俄羅斯,以後每小時搬一次伺服器也成。

乖乖不得了,我家附近的防空洞在哪裡?

404

模擬器

從報上讀到一則趣聞,謂某學者向一群五歲的小朋友進行了一項測試:給每人一枚糖果,但叮囑只要忍耐五分鐘才吃的話,便可以另外獲獎一枚糖果。結果是一部分小朋友待過了五分鐘才吃,另一部分則偷吃了糖果。然而,有趣的地方是在二十年後,學者又訪問了那班已經成年的研究對象,統計出當年沒偷吃糖果的小朋友,成就都比另一部分的研究對象較高。讀到這裡,我驚訝於這位學者,竟然為了一項研究,可以經年累月地去等足二十年。

然而,並非每項研究也容許花這麼長的時間去等,所以我們便利用電腦學的人工智慧技術來創造一個跟現實相同的虛擬世界,讓我們可以利用運算數據來作預測,而這個虛擬世界叫作模擬器(Simulator)。以環境保護為例,科學家揚言,一百年後,地球的平均氣溫會上升二至五度。一來,我們沒有這麼長的壽命去求證;二來,我們也不希望問題惡化下去,所以我們便用上模擬器來預測一百年後對地球的影響,假如模擬出來的結果是負面的話,這便成了環境保護有力的理據。

但要『創造』一個跟現實一樣的世界談何容易?因為現實本身就不是一件簡單的東西。又以環境保護為例,經濟發展會否令環境惡化?人口增長又如何?另外戰爭、中國掘起、鐵路發展、混燃汽車的普及,甚至潮流、個人生活模式的轉變等等,都可以是客觀數劇據的一部分。若然忽略了其中一項,則嫌研究不夠客觀;但若要統統計算在內,恐怕要用上超級電腦,運算數年才能得出結果。

然而,當中亦有簡單的模擬器,例如超級巿場在模擬器上試業,測試人流、人手安排等等,計算出最具成本效益的營運模式;早年亦有電腦公司推出以模擬系列的電腦遊戲,例如 Sim City、Sim Tower、Sim Life 等等。隨著電腦運算速度愈來愈快,模擬器將變得廣泛。未來,女孩子在初次約會之前,可以先把兩人的資料輸入模擬器,再計算廿年後的境況 ── Oh My God,他不但口臭、粗魯、無上進心、還愛打老婆,為免『遇人不淑』,還是爽約算了。

怪不得運程書籍會這般暢銷。

362

快‧快‧快

最近在修讀 Linux,總覺得老師有點兒備課不足,每課都會出亂子,不是某個指令串錯,便是沒法如書上所承諾般在電腦上兌現。然而,我仍然對老師充滿信心,只是 Linux 變得太快。舉例說,Fedora Core 首度亮相於 2003 年十一月,三年下來,現在已經是第五版了,而第六版也將於下周面世。算一算,大約是每半年推出一個更新版本。當半年前某個 module 的設定檔還在 X 資料夾時,在今天的版本裡可能已經移到了別處,又或者同一個指令已經更改了設定格式。就像你的汽車懂得每半年更新系統一樣,忽然由左駄變成右駄、自動波改為加減波、剎車器無端加上反鎖裝置﹝ABS﹞等等,這一來,誰都會顯得措手不及。

許多年前,跟職業訓練中心設計了一句廣告標語:『時勢瞬息萬變,你有沒有足夠技能去裝備自己?』意謂世界是在急速改變中,今天還依賴打字機、計算尺和算盤的人,難免要被世界淘汰。只是開源碼﹝Open Source﹞的發展,令已經『瞬息萬變』的世界改變得更快,除了上述 Fedora Core 的例子外,你知道開源碼的網上瀏覽器 Firefox 自四年前推出以來,一共出了多少個更新版本?一共是四十四個。所以說,要陷害一個電腦人其實不難,只要送他上一艘環遊世界的油輪上,要他一年半載才歸來,就像浦島太郎遊覽龍宮一樣 ── 回頭已是百年身,當他還是糾纏在 C 語言上的時候,這裡已經是 Java 的世界了。

昨日看了香港電台的《數風流人物》,當中嘉賓倪匡先生道出了一件趣事,謂他剛結婚之後,一次在巴士上遇見倪太,但他竟然認不出自己的老婆來。女人跟開源碼一樣可以『瞬息萬變』,也許她改了髮型、換了一套從義大利進口的連身裙、戴上一條鑽石項鍊,你都要像玩找不同一樣眉精眼企。有時候,她會略略改變一下喜好:例如她會忽然把手指腳趾都塗上了青色;明明在減肥,卻想去品嚐燒肉油雞飯;最要命的是,她會送你一套粉紅色的裇衫,說是最新款式云云。

雖然 Linux 版本跟潮流變得一樣快,但你對 Linux 的迷戀必須存有像宗教一般的狂熱。你今天愛上了 Linux,便不會因為一兩個指令碼的改變而轉投微軟的陣營。你只要慢慢去用心適應,碰兩三次釘,再揣摩一下,切忌心浮氣躁,因為對著伺服器發脾氣一定討不了好處。

其實,女人跟 Linux 都是同出一轍的道理。

357

感性狂想曲

最新一期﹝6月號﹞的《科學人》雜誌中,報導了一則小新聞,謂精神科學研究員論證了人為什麼會對紅色特別敏感。他們認為這是因為人的血是紅色,而腦神經對紅色特別敏感,就是為了容易察覺同伴在『氣色』上的狀況。所謂氣色,其實就是血液的含氧量,含氧量愈高,面色會愈見紅潤。久而久之,一切頭暈身㷫、喜怒哀樂等等,身體都會借氣色來向同伴發出訊號 ,令我們在女朋友發脾氣之前,可以洞悉先機,趨吉避凶去也。

唸過電腦科人工智慧學的朋友都知道,理性和感性之間有一條不可超越的界線。換句話說,不論電腦的功能多大、速度多快,始終不能夠拿人類的感性去當數字般處理。舉例說,『If I am happy, then I laugh』。什麼是『快樂』?我們該如何把『快樂』作數學上的定義呢?除此之外,還有悲哀、痛苦、妒忌、害羞、憤怒、懊惱、激動、怨恨、甜、酸、苦、辣、鹹、澀、香、臭、霉、美、醜等等。單單一個美與醜的學問,哲學家便可以談上一千幾百年。

顏色,其實也是一樣感性的東西。舉例說,紅跟藍的分別在哪裡?你忽然間百辭莫辯,然後指著天說這是藍色,指著蘋果說那是紅色。多得人工智慧學的 pattern matching 技術的發明,電腦終於可以分辨出紅和藍的分別,那是三元色(255,0,0) 及 (0,0,255)的分別。但同一種紅,印在光面紙及普通紙上的分別,電腦是否又分得出呢?更深入的問題:電腦究竟喜歡光面紙上的紅,還是普通紙上的紅呢?

隨著科技的不斷進步,理性與感性的分歧正在逐步收窄。難保一天,學者最終會在兩者之間搭起一道橋樑。到時候,距離《未來戰士》的世界不遠矣。《科學人》這篇報導,令我思考科學家是否已經築起了理性與感性之間的橋樑?因為科學家已經把紅── 這種顏色抽絲剝繭地研究過澈底,然後得出結論說:人類對紅色的感情,其實早已根植在我們的基因裡頭。科學家能夠進一步把人類對橙、黃、綠、青、藍、紫的感情基因密碼解開,只不過是時間上的問題。到了這一天,我只需要把基本喜好的資料輸入超級電腦:

A) 我喜歡藍色

B) 她喜歡黃色

運算:

1) 紅色 * 性格 A = 藍色 → 紅色 / 藍色 = 性格A

2) 紅色 * 性格 B = 黃色 → 紅色 / 黃色 = 性格B

3) 性格 A % 性格 B > 1

電腦或許會告訴我說:『她不會喜歡你的,死心吧。』

352

RFID 革命

亦舒寫《朝花夕拾》時為 1986 年,當中有一幕我覺得特別深刻的,是來自 2035 年的陸宜在1985年找著了衛斯理先生,提及她腦袋裡頭植有一塊晶片。當時衛斯理的第一個反應是:她被騙了,晶片表面上是替國民帶來方便,實際上是情報局透過無線電波來監控著每一個市民。寫科幻小說的難度,是要在一個幻想的空間裡思考實在的人性,當人和機械人談戀愛的時候會如何?當地球被外星人入侵的時候又如何?劇情純粹虛構,但人性必須是真實的。然而,在真實的環境裡思考人性容易,但要在虛構的環境下思考人性則難。在腦袋裡鑲上一塊晶片之後,亦舒所想到的不是『方便』,而是『被騙了』。亦舒的預言並不用等到 2035 年才體現,這塊晶片其實早己安放在閣下的錢包裡頭,就像亦舒筆下的陸宜一樣,香港人還是相當純真呢。

近年,政府積極推行生活科技化,當中最為人津津樂道的是採用了 RFID 技術的八達通咭。假若說八十年代是電腦時代、九十年代是互聯網年代,這十年將會是 RFID 的年代。什麼是 RFID?全寫叫 Radio-frequency identification,中譯射頻識別條碼,簡單的作用像一塊方便的條碼﹝barcode﹞,但讀取 RFID 的資料不用對準紅外線槍口,只要把該件物件放在讀碼機的接收範圍之內,所有的 RFID 標籤都可以被識別出來。例如在超級市場選購了一大籃貨品後,顧客只要『經過』收銀處便可以完成結賬程序,並不需要逐件貨品搬到收銀員面前作結算;又例如只要貨車駛過讀碼機,車上所有貨品便馬上被點算好。RFID 的用途甚至可以更聰明,例如冰箱會不斷讀取存放食品及飲料的資料,如發覺某件貨品快將用罄或甚至已經過期時,冰箱便會自動連線到供應商作補購。

RFID 應用在百貨公司的測試計畫早於 2002 年已經開始,但於去年胎死腹中,其中一個原因是:私穩。理論上,小偷只要拿一個讀碼機便可以得知屋裡是否存有名貴物品、又或者從身上衣物的 RFID 追蹤物主的位置。RFID 在私穩上的問題並不是遙不可及的,以香港人的錢包為例,因為八達通的資料庫會儲存每張咭相關的使用紀錄,它會知道陳大文是一位四十八歲的行政人員,習慣每早到旺角的金龍酒家渴茶,七時四十五分結賬離去,然後在彌敦道近山東街的巴士站乘九龍巴士公司的 12 號巴士上班,因為他有習慣每早在星光行的麥當勞買奶茶,推算他大約是在八時十五分到達天星碼頭;然後,在八時三十五分用八達通進入廣東道 81 號的會港商業大廈,一時二十分在美心快餐店午膳;最愛吃的是燒肉切雞飯,因為他一年裡共點了這個餐一百八十二次,二時正返回會港商業大廈,直至六時十分下班;奇怪的是,他會先乘搭天星小輪往中環,會合李美麗小姐再折返尖沙咀,然後乘 12 號巴士返回旺角的住所;回家前,他會先到百佳超級市場購物,最愛吃的是金象香米、利是餅乾及新奇氏 3108 橙;間中也會買一兩包珍珍薯片 ……… 八達通並不是私家偵探,但卻對閣下的生活小節暸如指掌,可是除了亦舒外,卻從來沒有人懷疑過私穩問題。

雖然發咭公司誓神劈願地保證客戶的交易資料絕對保密,公司的信譽可信,但可能性卻仍然存在。

311

Program 鑊氣

我在研究院裡主修的是人工智慧學和資訊科學,擁有兩台互聯網伺服器,驟聽起來好像很科學的樣子,但其實食古不化,我對生活電腦化還有一點抗拒。原因我唸的人工智慧學,並不是去解說電腦如何萬能,而是去認識電腦的無能。電腦並不是神仙,但人卻常常對它們過份期望。舉例說,最近一次本地中學科學比賽中,有一件作品是裝在交通燈裡的發訊機,當盲人路過十字路口時,手杖會接收發訊機的訊號,然後提示盲人是紅燈還是綠燈。紅燈停、綠燈行,這是個公認的道理,但要是交通燈亮了藍燈怎樣辦?藍燈?你認為這是個笑話嗎?要是交通燈一定不會出錯的話,那麼新聞從業員都可以執包袱了。電腦跟人腦的分別在於這個所謂『智慧』是真還是假,電腦只會執行,不會思考,非黑即白,非紅即綠,藍燈的情況沒有 progam 進去的話,它便不會自行判斷。當然,出現藍燈的機會率可能低至千萬分之一,但要是發生了,後果承擔得來嗎?

社會愈來愈先進,電腦愈來愈普及,連帶我們都要為了遷就電腦而把生活機械化。人逐漸變得單純,少了變通,缺乏人情味。試想,你聽過多少次『電腦不容許』這句說話?電腦打不出這個口語字;這份文件電腦說沒有;輸入了關鍵字,但仍然找不出資料;這件貨品不能少收五角錢;最經典的例子,莫過於機場開幕當日,電腦系統癱瘓,空運貨物進行不了交收。中國商貿發展了幾千年,到頭來,沒有電腦竟然成不了事。電腦是人的工具,是用來提升我們的生活質素,不能為了遷就電腦的『智慧』而令我們變笨,這是本末倒置的方法。

今天讀到一則新聞,謂內地有發明家設計了一部自動炒菜機,簡單易用,放入菜、水、油,等一段時間便成。為此,記者訪問了某餐廳的廚子,他笨拙地回應:『機器當然唔可以取代人手,因為炒菜要講鑊氣同咩~家馬。』咩?!不是他讀得書少,不懂得表達,而是人生的味道本應不言而喻。想一想,『鑊氣』可以 program 得來嗎?人跟電腦,就是百樂和千里馬之間的關係,濫用了電腦,連未來的菜都會變得無味。

283

用心

自從電腦發明了以後,我們都喜歡把所有事情量化﹝Quantifing﹞起來。翻開報紙,治安有一個指數、蚊患有一個指數、特首民望有一個指數、年青人會考後對前途樂觀與否有一個指數、對中央的信任程度有一個指數、明星人氣也有一個指標。民望、樂觀、信任、名氣,連這些抽像的概念 都有一套數學公式去計算,當數據達到了某個標準後,便可以對號入座地介定為『嚴重』、『高』、『低』、『好』、『壞』。如此,市民便可以更清晰地掌握實況。

今天是科學發達的年代,把攏統的概念歸納出一個量度指標是人類進步過程中所必須的。例如特首民望由七十分跌至現時的四十四分,證據確鑿,總好過中央高層不斷在塗脂抹粉。 但讀者也許知道,我對這種指標其實不甚認同﹝見《生活數字化》﹞,因為我從來也不相信單靠一兩個數字可以完全表達一個人 / 一件事的全面。特首民望跌至四十四分,只不過是一個數字而已,有人拒絕握手、有人高叫下台、有人拒絕受勳、五十萬人上街,當中的悲、歡、憤、慨、恩恩怨怨,數字都不能表達出來。單是我們每日所見所聞,許多只能用感覺去領會的,都不能量化。硬去堆砌的話,最終只會令數據更加脫離現實﹝見《笑談工作指標》﹞。

世間上有許多東西是永遠不能量化的,『求學不是求分數』就是當中最明顯的失敗例子。一直以來,學生的能力、知識、質素都用分數來量化,結果是誕生了學生為考試而讀書的怪現象。藝術也是跟量化有明顯矛盾的,票房不能用來區分王家衛跟王晶電影的分別,也不能判斷究竟是黃秋生演得好還是曾志偉演得好;文章寫得好壞,也不能以讀者多寡或銷量去判斷,尤其在香港,經典的文學作品往往是沒有人看的。

要了解一個人,不能夠單靠數據,不論是工作表現指標﹝performance indicator﹞還是 ICQ 上的 profile。因為量化指標可以量度一個人的勤奮、效率、錯誤率,甚至財富、學歷、年齡,但永遠量度不了人的心。一件工作他是否用心去做?文章是否用心去寫?照片是否用心去拍?歌是否用心去唱?戲是否用心去演?一切只能夠心領神會,不能量化。還有良心、愛心、痴心、同情心、忠心、關心、真心、熱心、專心、偏心、機心、野心、貪心、歹心、黑心、居心 …..當中又有幾多『心』真正可以從數據中表達出來呢?愛情,也是用心去感受的。要挑選一個伴侶,總不能只講表面的條件,就算他如何德才﹝財﹞兼備、她如何天姿國色也好,一切都不是首選,最重要還是他 / 她有沒有用『心』去愛過你。

281

資料、資訊

最近偉入讀了某大學的研究院,專程相約他出來閒聊。我問他在研究院裡讀的是什麼科目,他說 Information Science﹝資訊科學﹞,我自從修讀過圖書館科學後,一聽人說起這兩個字我都會無名火起,連隨莫須有地『省』了他一頓。Information Science 這個字本身有語病,名字由來詳見《Oops囉》。在我檯頭的字典裡,Science 的意思是『the study of some aspect of behavior』,意指研究及解釋一項科目,所以 Natural Science 解釋作 the Science of Nature、Social Science 也解釋作 the Science of Social behavior,唯獨一般的 Information Science 並不是 the Science of Information,因為他們著眼在教電腦﹝尤其是資料庫﹞,而沒有去研究資訊本身的特質,所以極其量只能說是 the Science of Information Handling﹝處理資訊的科學﹞。因為我同時擁有電腦科學及資訊科學兩項專業資格,我說了,倒是沒有人敢來反駁。至於怎樣才算是資訊科學?在圖書館學校裡,其中一科所學的是認知心理學,即是當人接觸到資訊後,如何吸收並記憶在大腦裡,這才是 the Science of Information。

Information Science 的另一個謬誤是錯用了『資訊』這個字,與其說是資訊﹝information﹞,倒不如說是資料﹝data﹞。到底資料跟資訊有什麼分別?今天的 IT 人十居其十也分答不出這個問題,還敢自稱在唸『資訊科學』?資料跟資訊之別,在於資料本身是沒有意思的,例如未經分析的數據,要附加上人的智慧及見解,才可以演化成訊息。舉例說,每天我們在金融市場上可以獲得許多數據,但仍要經分析員研究後才可以得出有用的資訊,例如某某的股價現高於市值,短期內或許會下跌等等。在現今科學的進度而言,電腦還未達到可以不經人手地去理解數據裡潛藏的訊息1。今天在搜尋器裡處理的,都是經 Spider 去把網頁找出及收藏,當中沒有經過分析,所以一概都是資料,它們不會保證資料是否詳盡、有用及準確的,始終要人去鑑別,所以 Information Science 要是改用 Data 一字,應該比該貼切。

上星期到營養師處覆診,一個月來只輕了五磅,比起初期的一周四磅來說,進度並不如意。但一個月五磅只是數據,本身是沒有意思的,經專家評價了之後,她說:『可能是已經輕了脂肪,但長了肌肉,兩者打了和的關係。』我要是跟她換掉性別的話,我肯定會因她這一句花言巧語而傾心。經分析後的資訊,往往會隨個人的理解而存有不同取向,潑婦會指著我的鼻尖鬧:『睇o下你,又肥左喇,減肥又無恆心,又唔戒口……』溫柔的會說:『這是因為長了肌肉的關係。』當中加進了寬容、鼓勵、關懷、細心、體貼、善解人意,當中的分別不言而喻,電腦這條笨牛又怎麼會懂?

 

  1. Datamining 可以,但只能局限於預先設定好的資訊,再由電腦去對號入座。

259