《數學之美》,一個從事多年工作的谷歌研究員眼中的數學。令我大飽眼福的是,大學裡面的數學知識竟能如此廣泛運用到了計算機行業中。
在語音識別、翻譯,還有密碼學領域,有著許多基於機率統計的模型和思想。當然,貝葉斯公式是基礎,套用到隱含馬爾科夫鏈模型,神經網路模型。
在搜尋中,一些相關性的計算,無不用到了機率的知識。在新聞分類中,用到了一些有關矩陣特徵值、相似對角化的知識。當然,在圖像處理方面,矩陣變換可謂是無處不在。另外,在識別方面,有一些通信模型,涉及到了信道、誤碼率、信息熵。
最近剛開學也沒什麼事,所以就想隨便找幾本書看一下,但最好別是那種太艱深晦澀的書。8月份一直到現在,吳軍寫的這本12年5月出版的《數學之美》一直盤踞京東、亞馬遜等各大網上商城科技類圖書的榜首,當然,還有早些時候出版的《浪潮之巔》也排在很靠前的位置。心想市場的力量應該能幫我挑出好書吧,於是就從圖書館借了一本來,一直到今天晚上把它給看完了。
因此想寫一點東西來總結、反思一下,反正剛開完班會也沒什麼事乾。
寫在前面的建議:如果你不討厭數學的話,強烈推薦這本書,網上也可以下到電子版,不過閱讀感覺上還是很不一樣的。
廢話就不多說了,《數學之美》其實是一本科普類的讀物,所面向的是接受過普通高等教育的人,完全不需要在特定領域有很深的造詣就可以看懂,大概懂一點線性代數、機率統計、組合數學、資訊理論、計算機算法、模式識別最好(雖然列舉了這麼多,其實有些不懂也沒關係……),所以尤其適合信科的人看。內容大部分是和人工智慧、計算機相關的,這並非我所學的專業,但作者比較擅長將看似複雜的原理用簡明的語言表達出來,所以可讀性還是很好的。
吳軍是清華大學畢業的,之前任職於Google,後來到了騰訊,這些文章都是發表在Google黑板報上的,後來經過了重寫,所以網上下載的和書本內容有所差異。由於吳軍本人是研究自然語言處理和語音識別的,所以統計語言模型的東西可能會多一點,不過我覺得這絲毫不妨礙全書數學之美的展現……感覺收穫還是挺多的,知識上的有一些,但更多還是思維方式上的。作者舉了很多例子試圖讓人明白很多看似複雜的高科技背後,基本原理其實是出乎意料簡單的(當然,必須承認第一個想到這些方法的人還是非常了不起的……)。比如高準確率的機器翻譯,看上去好像是計算機能夠理解各國語言,隱藏在背後的卻是很多具有大學理科學歷的人都非常清楚的統計模型和機率模型;再比如拼音輸入法的數學原理,早期的研究主要集中在縮短平均編碼長度,比如曾經流行一時的五筆輸入法,而現今真正實用的輸入法卻是有很多信息冗餘、編碼長度比較長的拼音輸入法,作者從資訊理論和市場的角度做了簡單的闡述;又比如新聞的自動分類,許多非IT領域的人可能會認為計算機可以讀懂新聞並進行分類,而實際上只是特徵向量的抽取、多維空間中向量夾角的計算,非常非常簡單,但凡學過一點線性代數的人絕對是一看就懂的……當然,完美的實現還需要考慮很多細節和現實的情況,但這並不是這本書所關注的地方,數學之美在於其簡()潔而不是繁瑣。
除了對於具體信息技術的剖析之外,作者還花了很大篇幅來講一些傑出人士的成長過程,特別是把這些人的成長經歷和中國學生的成長經歷作對比。雖然作者並沒有明說,但字裡行間多少流露出對於中國高等教育以及很多中國企業的批評,一是教育的功利性,缺乏寬鬆的獨立思考的環境,即使學了一堆理論也難有用武之地,自然也就缺乏創新性的成果;二是中國企業的短視,大部分都不捨得在新框架開發上投資,而是坐享學術界和國外企業的研究成果。
總結一下呢,《數學之美》事實上不能帶給你編程能力的提升,也沒法讓人的數學水平有顯著的提升,但它在很大程度上讓你跳出教科書式的繁瑣細節的束縛,能夠從更巨觀的角度來思考信息世界背後的數學引擎的運行原理,讓人明白看似很高級、複雜的東西背後其實並不如我們所想像的那樣複雜,而我們所學的「枯燥」的數學真的可以「四兩撥千斤」,改變億萬人的生活。