金石堂網路書店 購物推薦 精準預測:如何從巨量雜訊中,看出重要的訊息?



金石堂網路書店 文學推薦

精準預測:如何從巨量雜訊中,看出重要的訊息?





精準預測:如何從巨量雜訊中,看出重要的訊息? 評價



網友滿意度:



看書是一個最快增加"經驗"和"想法"的方式

你想過的、不曾想過的,

都有各式各樣的人把不一樣的體驗分享給大家

這也是我為什麼這麼喜歡讀書的原因~

但是讀書真的不能挑食,偶爾各式各樣的書

都要稍微看一下,才不會說在些關鍵時刻

缺了判斷的依據或概念>_<

像是這次看了覺得很有收穫的

精準預測:如何從巨量雜訊中,看出重要的訊息?

就會是我想推薦給大家的書~

不知道就偏好而言看官喜不喜歡呢?

畢竟也要有愛才能把書看下去嘛!XD

另外附上我常用的折價券網站~

加入@Line粉絲團就能夠輕鬆拿~太陽石功能

推給大家試試看囉;)



精準預測:如何從巨量雜訊中,看出重要的訊息?



本週熱銷商品:





風險下的錢景:中國風險投資關鍵與經營戰略







深不可測:大陸市場的機會與陷阱







商品訊息功能:

商品訊息描述:


























    • 《精準預測:如何從巨量雜訊中,看出重要的訊息?》



      2008年美國總統大選,他成功預測歐巴馬勝選。

      50州個別選舉結果,49州預測正確。

      35席參議員的勝選者,則全部猜對。

      2012年,他再次成功預測歐巴馬勝選,

      這次,50州全部命中。



      他開發的棒球預測系統精準無比,

      被知名棒球評論媒體收購。

      他個人更曾運用統計預測的專才,

      在德州撲克賭局賺進上千萬元。



      他是奈特.席佛,

      當代最受矚目的統計與預測鬼才,

      首次公開精準預測的黃金法則,

      告訴你為什麼有些預測會成功、有些會失敗?



      ★出版三個月穩居亞馬遜書店銷售總榜前20 名、商業理財類第1名、政治社會科學類第1名

      ★《紐約時報》暢銷書排行榜前10名

      ★榮登亞馬遜書店2012年度「非文學類」第1名

      ★獲選為亞馬遜書店編輯嚴選2012年度商「商業類」最佳書籍

      ★獲選《華爾街日報》2012「十大最佳非文學類好書」

      ★《紐約時報》書評盛讚:「10年來最重要的一本書」

      ★2009年《時代雜誌》將奈特˙席佛列入「世界最有影響力的百大名人」

      ★2012年《滾石雜誌》將奈特˙席佛譽為「改變遊戲規則的人」



      數據不會說話,是你在為它說話。




      ˙美國政府長期蒐集許多情報,但為何還是無法預見911恐怖攻擊?

      ˙2007年房市泡沫爆發前,華爾街的金融專家們為何看不見崩盤的警訊?



      身處「巨量資料」(big data)時代,照理說我們擁有空前充足的資料,去做各項預測。但各行各業掌握最多資料的專家與決策者,卻都還是不斷做出失敗的判斷,這是怎麼回事?作者奈特.席佛指出,人的解讀比數字更關鍵,而預測最難的部分在於:人要懂得分辨出哪些是無意義的雜訊,哪些才是關鍵的訊號。誤把雜訊當訊號,做出來的預測,自然不會準確,甚至會造成嚴重的謬誤與損失!



      數據導向的預測會成功也會失誤,要求更多數據之際,人更應該自我要求。



      最常出錯的就是過度自信、被稱為「刺蝟」型的預測者,他們很會歸納、喜歡大原則、很有膽識,雖不斷收到新訊息卻很少修改預測,他們做預測常成為一種「表演」,模糊了追求精準預測的動機。(代表人物:成為名嘴的專家、認定自己能翻盤的賭徒。)



      另外一個大家常犯的錯,是忽略「樣本外」的重大新資訊。假設你從未酒後駕車,肇事紀錄也很低。今晚你喝了酒,請預測今天駕車肇事的機率?如果你拿過去的記錄分析預測,那麼你出事的機率肯定相當低;但是喝酒開車並不在你過去記錄的樣本內。這個預測問題出在模型錯了、忽略樣本外的重大訊息──而這也就是席佛認為,大家對房市泡沫以及雷曼兄弟垮台,無法精準預測的主因。



      在本書中,席佛針對政治選情、球賽結果與球員價值的評估、金融風暴、氣象、地震、撲克賭局、西洋棋賽、股市投資等跨領域的預測難題,做了精闢的個案分析。雖然領域迥異,但預測要精準,背後的原則與邏輯卻都是一樣的。在一個個精彩的故事中,即使沒有統計背景的讀者,也能一點一滴拼湊、建立預測的基本功,並且可以練習把這些原則與技巧,運用在自己的專業領域上。(甚至可以用來預測伴侶外遇的機率:詳見第8章)



      ◎席佛在書中不斷提醒預測者:

      ˙預設立場或過度自信,對預測來說,是非常可怕的事。

      ˙預測不是在追求是與非,而是估算事情發展的「機率」。有精準的機率,才能做出有利的決策。

      ˙做預測時,最怕一看見「有相關」就解釋成「因果關係」。(冰淇淋 vs. 森林大火)

      ˙預測時不能忽略「誤差」,並要勇於承認有「不確定性」。 不然你會過度解釋,變成不精準的預測。

      ˙根據預測出來的機率,做了最有利的選擇,即使最後結果不好,仍然是好預測。

      ˙在很多情境中,不是一定要追求終極完美的預測,只要預測比競爭對手好,你就贏了。

      ˙當大家不免被雜訊迷惑時,問問自己,你有什麼法寶,能讓自己更接近真相?跟著法寶走,不要跟著群眾走。

      ˙有新的重大資訊進來時,能保持客觀,隨時更新的預測,才有可能是精準的預測。





      ◎書中也有許多發人深省的預測思考訓練:



      【情境1】在股市裡,為什麼贏的人反而輸了?

      現在舉辦一場拍賣會,拍賣一個裝有零錢的罐子,大家去猜測裡面有多少錢,並決定你願意用多少錢去標這一罐錢。出價最高的,可以把罐子帶走。



      這是經濟學裡一個常見的實驗,實驗的結果,往往都是這位贏家所出的錢,大過罐子裡的錢。沒贏就算了,贏了反而賠錢,這就是所謂的「贏家的詛咒」。這件事的問題出在,贏的那個人,做出了很糟糕的預測。很多時候,是預測者過度自信了。



      這個實驗,跟股市的特性是一樣的。往往當許多投資人都「感覺現在是投資的好時機」時,同時期股價都會飆高。雖然這明明跟股票應該買低賣高的邏輯背道而馳,但是人總是會在這些時候特別樂觀,大膽搶進。所以這些投資人,如果在股市裡失利了,都是因為他們誤將樂觀氣氛這個雜訊,當成可以搶進的訊息,做出了錯誤的預測的關係。



      【情境2】為何九一一攻擊時,第二棟大樓被撞不用太驚訝?

      根據貝氏定理,做預測時,事前某件事的發生機率有多高,會很大程度影響後來的發生機率。



      九一一恐怖攻擊那天早上,大多數美國人都會認為恐怖分子用飛機撞進曼哈頓高樓的機率趨近於零。那是第一架飛機還沒撞進大樓前的數據。等到第一架飛機事故發生之後,第二棟樓被攻擊的可能性就無庸置疑了。



      根據貝氏定理的公式計算,第一架飛機事故前,美國高樓被恐怖攻擊的可能性根據歷史紀錄可是兩萬分之一,或者說0.005%。第一架飛機事故發生後,美國被恐怖攻擊的機率當下被改寫,提高到了38%。這時,當我們再預估第二架飛機撞上高樓發生的機率時,運用貝氏定理的公式計算之後,整體機率陡增到99.99%。(貝氏定理用一行簡單的公式就能算出這個機率,詳見第8章)



      然而,一般人「憑感覺」的預測卻是:在艷陽高照的紐約,發生一次意願已經夠不可能了,第二次幾乎是真的完全不可能!但使用貝氏定理,卻能輕鬆預測第二起事故的發生。這就是為什麼我們在做預測時,不能憑「感覺」,而要信賴客觀工具的原因。





      【情境3】氣象預報不準確,能不能怪罪預報員?

      依照基本原則來看,所有的預測,顯示的結果應該都是機率,而且一定會有不確定性。氣象的預測,也不例外。



      美國國家氣象局經過長年來的努力,所取得的氣象資料以及他們的預測,準確率已經大有進展。然而,為何大家仍覺得氣象預報不準?



      這是因為商業氣象頻道,為了顧客服務的經濟動機,有時會在資料的呈現上做些操弄。比如,當他們說降雨機率20%時,有時其實只有5%。因為民眾對於這種幫助提高警覺的「假警報」不介意。相對的,若他們預期不會下雨時卻下雨了,大家就會咒罵氣象頻道毀了他們的野餐。而且,氣象預報時,更無法呈現出「不確定性」,誠實展現出預測中的不確定或者誤差,也會有損預報的權威感。



      在這樣的情況下,並不是預測技術無法精準,而是氣象頻道實在沒有砥礪自己追求預報精準的動機。然而,這是個惡性循環。結果就是當真的發生卡崔娜這樣的颶風時,很多已經把氣象預報當成「狼來了」的民眾,就可能會喪失性命。



      作者認為,一個預測的人,職責就是應該要盡力做出精準的預測與預報。這一點,氣象的預報人員,沒有做到。雖然本來也許有時是出於好意。















        【國內各界專家讚譽推薦】

        尹相志(亞洲資採、亞洲決策資訊技術長)

        吳 迪(統計學補教名師)

        林之晨(appWorks 之初創投合夥人)

        許毓仁(TEDXTaipei策展人、TED亞洲大使)

        蔡恩全(台灣微軟總經理)

        戴季全(Richi里斯特、TechOrange流線傳媒創辦人)

        *以上依姓名筆劃順序排列



        【國際主流媒體齊聲讚譽】



        「奈特.席佛是美國選情借的某種禪學大師,......這本書就如耳熟能詳的《黑天鵝》的那個脈絡,認為人對自身的預測能力太過自信,很難建立一個容許不確定性的預測模型。」-《經濟學人》



        「席佛探索了我們對於預測股市、暴風雨、運動賽事,以及其它難以確定的事的可能性。」-《連線雜誌》



        「這是在巨量資料侵襲所有行業、所有運動賽事,以及所有決策者的時代,大家必讀的一本書。」-《富比士雜誌》



        「十年來最具影響力的書。」 -《紐約時報》書評



        「席佛娓娓道來的文風,讓艱難地統計資料,變得可親。而且這些論點與案例,都是經過深度研究得來的。」-《華爾街日報》



        「奈特.席佛可謂統計界的搖滾巨星。這本書結合實用手冊與哲學思辨的宣言於一體。」-《波士頓環球新聞》



        「席提供了一個難得容易閱讀的作品,可說是做預測的基礎入門。」-《華盛頓郵報》



        「這本書是許多東西的綜合體,既是貝氏定理對機率理論的介紹,也是人們對運氣與人格的冥思,又揭發撲克遊戲的內幕,......而它最重要的新意在於,它很人性。」-《君子雜誌》



        「這本書把會把人嚇退的主題,寫得很有娛樂性,讓大眾能夠親近。」-《頁岩雜誌》













      解讀數字,是新的識字能力。資訊越多,越要學過濾雜訊。

      作者奈特.席佛 (Nate Silver)他精通統計學,是美國當代知名的統計與預測鬼才。他從小就對數字與思考展現興趣與天分,六歲便開始預測棒球賽事。許多人對於他的統計模型與精準預測的技術都十分折服與好奇,本書是他首度公開自己的預測祕訣,以及他對各領域預測的研究與思考。書中席佛針對政治選情、球賽結果與球員價值的評估、金融風暴、氣象、地震、撲克賭局、西洋棋賽、股市投資等跨領域的預測難題,做了精闢的個案分析。雖然領域迥異,但預測要精準,背後的原則與邏輯卻都是一樣的。在一個個精彩的故事中,即使沒有統計背景的讀者,也能一點一滴拼湊、建立預測的基本功,並且可以練習把這些原則與技巧,運用在自己的專業領域上。

























      • 作者介紹







        奈特.席佛 (Nate Silver)



        他精通統計學,是美國當代知名的統計與預測鬼才。他從小就對數字與思考展現興趣與天分,六歲便開始預測棒球賽事。高中時代曾拿過密西根州辯論冠軍,後來進入芝加哥大學主修經濟學,並在大三前往倫敦政經學院研修一年。大學畢業後,進入安侯建業事務所(KPMG)擔任顧問。利用工作之餘,研發出一套創新的棒球賽事預測系統PECOTA,因為精準至極,甚至吸引棒球界聖經 Baseball Prospectus 於2003年向他收購。席佛也將他統計與預測的天賦應用於德州撲克,曾經短期內就讓他贏得上千萬元財富。



        他在2008年美國總統大選之前成立了「五三八」網站,發表他的選情預測,獲得廣泛注意,隨後他在這個網站公布預測,成功預測歐巴馬勝選,而且是在50州的個別選舉結果中,49州預測正確,35名參議員選舉更完全命中。2012年的總統大選,他再度成功預測歐巴馬勝選,這次50州全部命中。2009年《時代雜誌》並將他列入「世界最有影響力的百大名人」。許多人對於他的統計模型與精準預測的技術都十分折服與好奇,本書是他首度公開自己的預測祕訣,以及他對各領域預測的研究與思考。







      • 譯者介紹





        蘇子堯



        台灣師大翻譯研究所碩士,台灣師大教育心理與輔導系學士,曾任國中教師、組長、主任。譯有《焦點解決教育--一個更快樂的學校》、《愛我,就不要控制我》與《南瓜計畫》等書。



















      精準預測:如何從巨量雜訊中,看出重要的訊息?-目錄導覽說明





      • 前言

        1. 慘烈的預測失誤

        2. 你比電視名嘴還聰明嗎?

        3. 我在乎的只有輸贏

        4. 多年來你一直告訴我們雨是綠的

        5. 拚命找訊號

        6. 要怎麼淹死在一公尺深的水裡

        7. 模型的角色

        8. 錯誤越來、越來越少

        9. 對機器大發脾氣

        10. 撲克泡沫

        11. 要是你贏不了他們

        12. 有著健康懷疑態度的氣氛

        13. 你不知道的東西可能會傷害你結論



















      前言



      這本書談的是資訊、科技,以及科學的進步。這本書談的是競爭、自由市場,以及思想的演變。這本書談的,是讓我們比任何電腦都還要聰明的東西,也是本探討人為錯誤的書。這本書談的,是我們如何一步步學會掌握客觀世界的知識,而我們為何有時又會倒退。



      這本書談的是預測(prediction),也就是上述這一切的交集。這本書研究的是為什麼有些預測可以成功,為什麼有些會失誤。我希望,對於如何規劃我們的未來,我們可以得到多一點的了解,比較不會去重蹈覆轍。



      「巨量資料」的希望與困難



      現在流行的詞是「巨量資料」(big data)。IBM估計,我們每天會生產兩百五十萬兆位元的資料,有超過之九十的資料是在過去兩年中製造出來的。



      資訊指數性的增長,有時被視為萬靈丹,就如一九七〇年代的電腦一樣。《連線雜誌》(Wired magazine)的編輯克里斯?安德森(Chris Anderson)在二〇〇八年寫道,光是資料的量就可以免去對理論的需求,甚至連科學方法都不必了。



      這本書顯然是在擁護科學和科技,而我也認為這是本非常樂觀的書。但這本書的主張是:這些觀點錯得離譜。數字沒辦法為自己講話。是我們在為它們說話。我們賦予它們意義。就如凱撒一樣,我們可能會用對自己有利的方式來解釋資料,讓資料脫離客觀的現實。



      以數據為導向的預測會成功--也會失誤。如果我們否定自己在這個過程中扮演的角色,失誤的機率就會提高。在我們對資料做更多的要求之前,我們必須先多要求自己。

      如果你知道我的背景,我這樣的態度可能會讓人吃驚。我處理資料和統計數據,用這些來成功預測,因而博得名聲。二〇〇三年,我因為厭倦顧問的工作,所以設計了一個叫做PECOTA的系統,試圖預測大聯盟球員的統計數據。這個系統有一些創新之處--例如說,系統的預測是用概率的方法,為每位球員標出一個範圍內的可能結果--我們比較各家系統的結果,發現我們的系統比對手的系統表現更好。二〇〇八年,我成立了五三八網站(FiveThiryEight),試圖預測即將到來的大選。五十州之中,五三八網站正確預測了四十九州的總統大選獲勝者,以及全部三十五席美國參議院議員選舉的贏家。



      大選後,有一些出版商跟我接觸,他們想找《魔球》(Moneyball)和《蘋果橘子經濟學》(Freakonocomics)這樣的書,從書的成功中獲利,這種書講的是書呆子征服世界的故事。他們認為這本書走的也是這樣的路線--研究以數據為導向的預測,領域從棒球到財經到國家安全。



      但我為了從事我的研究,在四年內和十幾個領域、超過一百位的專家談過,閱讀數百篇期刊文章和書籍,到處旅行,從拉斯維加斯到哥本哈根,我逐漸明白,巨量資料時代的預測進展並不順遂。在幾個層次上,我一直很幸運:首先,雖然我犯了很多我後面要敘述的錯誤,但我還是獲得了成功;而其次,我選對了戰場。



      例如說,棒球就是個特例。這種運動剛好是種豐富而有意義的例外,而本書就在探討為何會如此--為什麼在《魔球》出現十年後,統計怪才現在跟球探合作無間了。



      本書提供了一些其他有希望的例子。氣象預報牽涉到人類判斷力與電腦能力的結合,也是其中之一。氣象學家名聲不好,但是他們已有顯著的進展,他們預測颶風登陸的位置比起四分之一個世紀之前準確三倍。同時,我也見了撲克玩家和運動賭徒,這些人真的能打敗拉斯維加斯。還有打造IBM深藍電腦(Deep Blue)的電腦程式設計師,這部電腦曾經打敗世界西洋棋冠軍。



      但是這些預測有所進步的案例必須用一連串的失誤來權衡。



      如果有什麼東西可以用來定義美國人--有什麼讓我們與眾不同,那就是我們相信卡修斯的想法,認為我們可以掌控我們自己的宿命。我們的國家是在工業革命之初由一群宗教的反抗者所建立,他們看出思想的自由流通不只有助於散播他們的宗教信念,也可以散播科學和商業的信念。我們這個國家大部分的優勢和劣勢--我們的智巧與勤勉,我們的傲慢與不耐--都來自於我們堅定不移的信念,相信我們可以選擇自己的走向。



      但是這個全新的千禧年卻給了美國人一個可怕的開始。我們沒有預見到九一一攻擊的到來。問題不在於缺乏資訊。就像六十年前珍珠港攻擊的狀況一樣,所有的訊號都在。但是我們沒有把訊號整合起來。我們缺乏適當的理論來說明恐怖份子會怎麼行動,所以我們對資料無視,恐怖攻擊對我們就成了「未知而不自知」(unknown unknown)。



      最近的全球金融危機也伴隨著普遍的預測失誤。我們輕易相信模型,沒有體認到我們所選擇的假設有多麼容易影響到這些模型,造成了損失慘重的結果。同時,就較為一般的基準來看,我發現我們沒辦法在幾個月之前就提前預測到經濟衰退,而且不是因為不夠努力。雖然在控制通貨膨脹方面已有相當的進展,但我們的經濟政策決策者卻是在盲目行事。



      二〇〇〇年總統大選前政治學家所發表的預測模型預測高爾(Al Gore)會以十一個百分點壓倒性的勝利,結果是布希(George W. Bush)獲勝。這不是個異常的結果,像這樣的失誤在政治預測上相當普遍。賓夕法尼亞大學(University of Pennsylvania)的菲利普?泰特洛克(Philip E. Tetlock)發現,政治學家宣稱某個政治結果絕對沒有機會發生的時候,卻還是有大約百分之十五的機會會發生。(不過這些政治學家大概還好過電視名嘴。)



      最近就像一九七〇年代那樣,重新興起對預測地震的努力,大部分的預測都是使用高度數學化和以數據為導向的技巧。但是這些預測設想的地震都沒有發生,有發生的地震也沒有讓我們做好準備。福島核子反應爐設計來對抗強度八?六級的地震,一部份是因為某些地震學家推斷更大的地震不可能發生。結果二〇一一年三月日本就出現了九?一級的恐怖地震。



      也有整個學科預測不斷失準,常常讓社會付出極大的大價。想想生物醫學研究之類的東西。二〇〇五年,一位在雅典長大、名叫約翰?約安尼迪斯(John P. Ioannidis)的研究人員發表了一份備受爭議的論文,標題為〈為何已發表的研究結果大多是錯的〉(Why Most Published Research Findings Are False)。這篇論文研究的是在同儕審查的期刊上記錄的正面研究結果:描述他們成功預測到某些醫學假設在實驗室裡實現。論文的結論是,把這些研究發現應用到現實世界的時候,可能大多會失敗。拜爾實驗室(Bayer Laboratories)最近證實了約安尼迪斯的假設。他們試著自己去實驗醫學期刊中所宣稱的正面研究結果,結果約有三分之二的研究發現他們無法複製。



      巨量資料一定會造成進步--最後還是會的。但速度有多快,以及我們會不會同時又退步,就要看我們了。



      為何未來令我們震驚



      生理上來說,我們跟我們的祖先沒有太大的不同。但是某些石器時代的優勢已經變成了資訊時代的劣勢。



      人類擁有的自然防衛不多。我們速度沒有那麼快,也沒有那麼強壯。我們沒有爪子或尖牙或是身體的保護層。我們不會吐出毒液。我們沒辦法用偽裝遮掩自己。我們不會飛。但是,我們憑藉著我們的智能活了下來。我們的心智靈活。我們天生就會找出模式,不用太多遲疑就能對機會與威脅做出回應。



      「這種找出模式的需求,人類比其他動物需求更高。」湯馬索?波吉歐(Tomaso Poggio)這樣告訴我,他是麻省理工學院的神經科學家,研究我們的大腦如何處理資訊。「要在艱困的情境中辨認出物體,表示需要歸納。新生兒可以辨認出臉孔的基本形態。這是經由演化才學會的,不是靠個人。」



      波吉歐說,問題是,這些演化的本能有時候會在其實沒有模式的時候影響左右我們,讓我們看見模式。「大家一直都會這樣,」波吉歐說,「在隨機的雜訊中找到模式。」

      人類的大腦相當卓越;可以儲存大約三TB的資訊。然而據IBM所說,這只是現在全世界每天生產的資訊量的百萬分之一。所以對於我們要選擇記得的資訊,我們必須極為審慎。



      艾爾文?托夫勒(Alvin Toffler)一九七〇年在《未來的衝擊》(Future Shock)一書中寫過,對於他稱之為「資訊超載」(information overload)的結果做了一些預測。他認為,即使這個世界本身越來越多元、越來越複雜,但我們的防禦機制會把這個世界簡化,確認我們的偏見。



      我們的生物本能在這個資訊豐富的現代世界不是都調適得很好。除非我們主動努力,去察覺我們引進的偏見,不然額外的資訊給我們的回報可能會很少--或是減少。



      印刷術問世

      {推薦序1}

      巨量資料不是萬靈丹,預測的模型更關鍵

      尹相志




      數千年前,古埃及人發現,尼羅河洪水抵達開羅的前一天,天狼星會與太陽同時從地平線升起;然而在地球的另一邊,「神農氏作蠟祭,以赭鞭鞭草木,嘗百草,始有醫藥。」看似無關的兩個人類古文明的演進,其實是一體兩面,都是在透過各種方式蒐集資料、分析資料,並且找出規律以作為日後決策使用。可以說人類的文明就是透過「分析與預測」一點一滴累積的。



      隨著人類的世界越來越複雜,分析預測必須透過更有效率的方式執行,也因此資料採礦與巨量資料變成現代顯學。本書有趣的地方在於,它並非一味地神話預測技術的無所不能,反倒是透過一連串的實例(金融海嘯、美國總統大選、恐怖攻擊......),來證明現代人類對於這世界預測模型的假設是多麼脆弱與簡化。但這並不是對預測技術的反動,反而是從過去案例中反省,告誡我們資料科學的發展除了要能協助人們從巨量資料中找出規則外,更重要的是要能夠讓人類辨別規則與雜訊間的差異,以及能夠評估模型失準時的風險。



      若是說人類在預測的技術尚不夠純熟,這是不公平的,更多時候,是人類不願相信預測出來的結果,或者明知道預測的事件即將發生,但是卻恣意反其道而行(或是往對自己有利的方向進行)。然而「預測」已不僅是少數分析者個人的工作,而是一種集體的行為,決定了人類世界如何被推動、如何分配資源。至此,「預測力」儼然成為一種全新的資訊不對稱的知識暴力。



      您也許不是一位資料科學家,看完本書也未必能讓您從這種「預測」的知識暴力種解放出來,但希望您能如作者所期許的:「平靜接受我們不能預測的事,勇敢預測我們能預測的事,睿智看出差異何在」。



      (本文作者為亞洲資採、亞洲決策資訊 技術長)



      {推薦序2}

      人類始終在追求對未來的精準預測

      吳迪




      丹麥物理學家尼爾斯.波耳(Niels Bohr)曾說:「預測很難,尤其對於未來」。在我教授統計學的過程當中,常常跟同學討論到學習統計學的目的為何?統計學的精髓在於如何「以管窺天」,利用樣本的資料來做分析,萃取出有用的資訊,做出「精準的預測」,而《精準預測》這本書正是告訴我們如何利用簡單的數學運算達成目的。實際上,預測對我們的生活而言不可或缺。例如:樂透號碼的選擇、決定投資股票的標的,或職業生涯規畫等,都是我們對未來的一種預測。由此可見,人類真正目的其實在於得到「精準預測」的結果。



      拜科技發達之賜,我們現在。龐大的數據固然提供我們強大的資料作為預測依據,然而數據不會說話,是資料分析師、統計學家,以及各種統計軟體在為它說話,也就是大家常提到的資料採礦(Data Mining, DM)。學者佛羅利(William Frawley)等人認為,資料採礦是從資料庫中挖掘出不明確、前所未知以及潛在有用的資訊過程。並從資料中提取出隱含過去未知且有價值的潛在訊息。因此透過資料採礦技術,從巨量資料庫中挖掘出「黃金」(即有用的資訊與知識)做出預測,支援企業決策分析,提升企業的競爭優勢。但以數據為導向的預測會成功也會失誤。本書作者認為預測最難的部分在於:從巨量資料中分辨雜訊和真正的信號。在書中作者提到,人們通常只選擇聽見對自己有利的數據,錯把雜訊當成信號,因而做出錯誤的判斷,這就是為什麼有些預測會失敗,而有些預測卻能與結果非常相近的主要原因。如果我們能學會分辨雜訊,準確判斷出數據中的訊號,我們仍有機會能成功預測,如同作者在二○○八年美國總統大選,成功預測五十州當中四十九州的總統勝選者,及三十五席參議員的勝選者。



      在了解問題與造成錯誤的原因之後,知道如何解決該問題的方法,才是「精準預測」之關鍵所在。若只是分析問題成因卻未提出解決之道,也將使其淪為空談。本書最大的特色在於,作者將內容分成兩部分:前面七章在判斷預測的問題,後面六章在探討與運用貝氏定理的解決之道。讀者可以據此訓練自己分辨雜訊和真正訊號的能力,從巨量雜訊中看出重要的訊號,不論讀者涉略何種領域(自然科學、社會科學、學術研究、企業或是行政部門等),相信透過這本書都能使預測的能力更為「精準」,從巨量資料中取出「黃金」。



      (本文作者為統計學補教名師)



      {推薦序3}

      揭開「預測」的神祕面紗

      林之晨




      在紐約大學史騰商學院攻讀MBA(企管碩士學位)時,我的統計學教授送了一句我永生難忘的話,他說:「無論統計的結果如何,如果你沒辦法找到它背後的道理,那就代表這次的分析出了問題。」



      換句話說,統計是一種用來印證道理──也就是事物間因果關係──的工具。當事物之間有某種因果時,統計可以協助你發現並且驗證這樣的關係,進一步預測這個因果再次發生的機率。相反的,如果事物之間缺乏真實的因果,則無論統計之後得到任何結論,也只是數學上的巧合罷了。



      讀奈特.席佛的這本《精準預測》,讓我不斷想起了教授的話。



      雖然一般公認,席佛是數據分析與統計模型的專家,但在這本書裡他一路從統計原理講到金融海嘯、棒球、氣象、地震、失業率、傳染性疾病、運動賭盤、西洋棋、德州撲克、市場原理乃至於全球暖化,每一個領域除了關鍵的資料與圖表,他幾乎都能夠明白闡述「為什麼」這些資料有因果意義,甚至常常進一步去分析造成這些因果背後的人性。



      用奈特自己的方式形容,他在這本跨越多個時空,厚重且實在的分析報告大彙整裡,充分展現了他的「狼性」,也就是跨學科、大膽找尋新方法、自我批判,並且以實徵為主的思考與工作方式 (請參照第二章)。



      至於為什麼我們該花時間學習奈特的工作方式,其中一個很重要的因素是網路與各式連網裝置──包括你手中的智慧手機與平板電腦──的普及,正帶來前所未有的數據供給成長──僅僅在過去兩年內,我們所產生的資料量就佔據了人類史上所有資料量的 90%。



      因此,就像奈特說的一樣,當你需要預測某個事件未來再次發生的機率,尤其當這件事會攸關國家安全、民眾健康、經濟發展,或是企業存亡等關鍵狀況時,從茫茫資料海中抽絲剝繭,找到那些關鍵指標的能力,將顯得越來越重要。



      在這樣的一個時代,奈特.席佛這本《精準預測》更顯得重要,這裡面充滿著現代知識工作者必須了解的種種數據分析觀念與實務技巧,非常值得每個人用心體會、學習,並且實踐。



      (本文作者為appWorks 之初創投合夥人)



      {推薦序4}

      從奈特.席佛看新公民媒體崛起

      許毓仁




      奈特.席佛是一個統計學家、數學家,也是一位知名部落客,畢業於芝加哥大學經濟系。畢業後在會計師事務所安侯建業(KPMG)服務,之後創辦了 PECOTA系統,用統計數字追蹤大聯盟棒球員表現。隨後他的興趣轉向政治,二○○七年他創辦了FiveThirthyEight.com, 準確地預測了二○○八年的美國大選,二○○九年他更被《時代》雜誌選為最有影響力百大人物之一。二○一二年奈特再度準確地預測了總統大選結果。他善長分析海量數據,並且準確預估出選舉的結果。他經營的FiveThirtyEight.com網站在選舉的時候擁有全美數一數二的流量,硬是超越大型新聞入口網站CNN、福斯新聞和民調機構蓋洛普(Gallup)與AC尼爾森(ACNielsen)。他根據自己準備的民調數字,無誤地預測了歐巴馬的勝率。這位奉數字為上,不與說客、競選助理、民嘴、公關公司打交道的數學天才,到底憑藉什麼能力讓所有大型民調機構跌破眼鏡,臣服於下?



      奈特的勝利背後涵義實為廣大。



      第一,它代表了新公民媒體的崛起。過去的政治媒體圈被說客、名嘴、大型民調公司控制,這三個角色形成了利害共同體,用種種不透明的方式控制結果。然而,社群媒體 (social media) 的興起讓每一個人都變成了媒體,都有發聲管道。當這些個人媒體 (individual media) 能夠準確預測結果時,舊有的勢力即將面臨挑戰,也在快速崩壞的過程中。這樣的新公民媒體 (new citizen media) 崛起也將不斷衝撞傳統的新聞傳播。



      這也代表著,第二,開放數據有助於促進政策透明化。奈特的成功有絕大的因素在於開放數據的運用。過去這些數據取得困難,讓選舉操作上有機可乘,在社群媒體的年代,開放數據 (open data) 是一項施政透明度 (policy transparency) 的指標。歐巴馬也大力提倡開放政府 (open government) 運動,而開放數據的取得也讓更多個人民調分析師更能合理的彙整、分析、解讀數據。未來,希望這些開放數據分析能讓議題的討論更趨向公評、公正,政策的透明化也將受到更多的監督。



      台灣長久以來受到媒體民嘴影響,許多議題、政策的討論過於激情、非理性。一般民眾取得資訊也過於片斷、不完整,整個資訊流缺乏一個完整的



















      編/譯者:蘇子堯
      語言:中文繁體
      規格:軟精裝
      分級:普級
      開數:0*14.8
      頁數:576

      出版地:台灣













    商品訊息簡述:








    • 作者:奈特.席佛

      追蹤







    • 譯者:蘇子堯








    • 出版社:三采

      出版社追蹤

      功能說明





    • 出版日:2013/9/6








    • ISBN:9789862299609




    • 語言:中文繁體




    • 適讀年齡:全齡適讀








    精準預測:如何從巨量雜訊中,看出重要的訊息?





arrow
arrow

    sarahwa21b7e 發表在 痞客邦 留言(0) 人氣()