大數(shù)據(jù)類(lèi)的讀書(shū)筆記
讀書(shū)筆記是讀書(shū)的時(shí)候經(jīng)常做的筆記,下面就讓我們來(lái)看看大數(shù)據(jù)類(lèi)的讀書(shū)筆記!歡迎閱讀!
大數(shù)據(jù)類(lèi)的讀書(shū)筆記
未來(lái)的十年,將是大數(shù)據(jù)引領(lǐng)下的智慧科技時(shí)代。不管你是否意識(shí)到它的存在,大數(shù)據(jù)都將越來(lái)越快地改變我們這個(gè)時(shí)代,包括我們的生活方式。
維克托·邁爾-舍恩伯格是最早洞見(jiàn)大數(shù)據(jù)時(shí)代發(fā)展趨勢(shì)的數(shù)據(jù)科學(xué)家之一。他通過(guò)一個(gè)大家熟知的事例,來(lái)幫助我們理解“大數(shù)據(jù)”的潛在影響力,那就是四個(gè)世紀(jì)之前望遠(yuǎn)鏡和顯微鏡的發(fā)明。望遠(yuǎn)鏡能夠讓我們感受宇宙,顯微鏡能夠讓我們觀測(cè)微生物,它們都是收集海量數(shù)據(jù)的新工具,因?yàn)檫@種工具的發(fā)明,人們同步更新了分析數(shù)據(jù)的技術(shù)和方法,促進(jìn)了人們對(duì)世界更好的理解。如果說(shuō)望遠(yuǎn)鏡和顯微鏡是測(cè)量領(lǐng)域中的一場(chǎng)革命,那么今天的數(shù)據(jù)測(cè)量就相當(dāng)于是現(xiàn)代版的望遠(yuǎn)鏡、顯微鏡。隨著社交網(wǎng)絡(luò)的逐漸成熟,移動(dòng)帶寬迅速提升,云計(jì)算、物聯(lián)網(wǎng)應(yīng)用更加豐富,以及更多的傳感設(shè)備、移動(dòng)終端接入到網(wǎng)絡(luò),由此產(chǎn)生的數(shù)據(jù)及數(shù)據(jù)的增長(zhǎng)速度比歷史上的任何時(shí)期都要多、都要快。一個(gè)大數(shù)據(jù)的時(shí)代,不經(jīng)意間順理成章地翩然而至。
一、什么是大數(shù)據(jù)?
大數(shù)據(jù)是當(dāng)前最熱門(mén)的話(huà)題之一。但什么是大數(shù)據(jù),人們尚未給出確切的定義。首先,“大數(shù)據(jù)”是相對(duì)過(guò)去小的、局部性的數(shù)據(jù)而言的;其次,利用大數(shù)據(jù)進(jìn)行分析和工作時(shí),所依據(jù)的關(guān)于此事盡可能完整的數(shù)據(jù),從而“一覽眾山小”,而不是采用局部的小數(shù)據(jù),從局部推斷整體。
維克托也并未直接給出大數(shù)據(jù)的定義。不過(guò),他用三大轉(zhuǎn)變描述了大數(shù)據(jù)的特性:
轉(zhuǎn)變之一:在大數(shù)據(jù)時(shí)代,我們可以分析更多的數(shù)據(jù),有時(shí)候甚至可以處理和某個(gè)特別現(xiàn)象相關(guān)的所有數(shù)據(jù),而不再依賴(lài)于隨機(jī)采樣。例如一項(xiàng)針對(duì)相撲比賽中非法操縱比賽結(jié)果的研究對(duì)64000場(chǎng)比賽進(jìn)行了分析,這算不上一個(gè)很大的數(shù)字,但由于這是過(guò)去十年所有的比賽,所以它是大數(shù)據(jù)。
轉(zhuǎn)變之二:由于有了更多的數(shù)據(jù),我們可以接受更多的混雜、更多數(shù)據(jù)上的不精確。如果我們對(duì)于一個(gè)事物只有50個(gè)數(shù)據(jù)點(diǎn),那么每一個(gè)數(shù)據(jù)點(diǎn)都必須非常精確,因?yàn)槊總(gè)數(shù)據(jù)點(diǎn)都是有用的;但是如果我們有5000萬(wàn)個(gè),去掉10個(gè),甚至去掉1000個(gè)都沒(méi)有太大的問(wèn)題。
轉(zhuǎn)變之三:不再探求難以捉摸的因果關(guān)系,轉(zhuǎn)而關(guān)注事物的相關(guān)關(guān)系。分析大數(shù)據(jù)主要為了預(yù)測(cè)未來(lái)“是什么”,而不是“為什么”。因?yàn)楹芏鄷r(shí)候我們以為我們找到了事情背后的原因,實(shí)際上卻沒(méi)有找到。更多時(shí)候知道了“是什么”就足夠了。例如知道流感將會(huì)擴(kuò)散到哪里就足夠了,我不需要知道為什么;知道什么時(shí)候在網(wǎng)上購(gòu)買(mǎi)機(jī)票能夠獲得最優(yōu)惠的價(jià)格就足夠了,我不需要知道為什么此時(shí)價(jià)格最低。
二、大數(shù)據(jù)帶來(lái)的變化
大數(shù)據(jù)從根本上改變我們認(rèn)識(shí)世界和改變世界的方式。很多傳統(tǒng)的習(xí)慣將被顛覆,很多舊的制度將面臨挑戰(zhàn)。舉例來(lái)說(shuō):
第一,科學(xué)探究的思路和方式受到挑戰(zhàn)
探究是新課程改革中的一個(gè)熱詞,是促進(jìn)學(xué)校教學(xué)與科學(xué)研究相融合的實(shí)踐舉措。科學(xué)探究的基本路徑是:發(fā)現(xiàn)問(wèn)題,提出假設(shè),制定方案,實(shí)踐探究,分析數(shù)據(jù),得出結(jié)論。之所以會(huì)梳理出這樣一個(gè)探究的路徑,與我們對(duì)問(wèn)題知曉的信息過(guò)少有關(guān)。換句話(huà)說(shuō),對(duì)所要研究的事物,我們知道的數(shù)據(jù)很少,需要從這些很小的數(shù)據(jù)出發(fā),通過(guò)猜想和假設(shè),進(jìn)行試探性的研究,如果研究得出的結(jié)果和自己的假想是一致的,則說(shuō)明我們的假說(shuō)是正確的,這些假說(shuō)會(huì)上升為對(duì)該事物描述的知識(shí),我們掌握該事物的數(shù)據(jù)也隨之增加。
利用測(cè)量所獲得的點(diǎn)滴數(shù)據(jù),從一個(gè)局部來(lái)推測(cè)世界是怎樣的,這是科學(xué)探究的基本思路和方式。長(zhǎng)期以來(lái),我們總是通過(guò)這樣的方式來(lái)認(rèn)識(shí)世界,對(duì)其有宗教般的信仰。盡管我們知道,決策者總是先有了想法,才會(huì)提出假設(shè)。如果決策者自身對(duì)所研究的事情存在著偏見(jiàn),所提出的假設(shè)就很難得到實(shí)證的支持,這往往會(huì)導(dǎo)致探究花費(fèi)了很長(zhǎng)的時(shí)間、很大的物力和財(cái)力,也常常勞而無(wú)功。但科學(xué)研究者還是堅(jiān)定不移地沿著這條道路前行,學(xué)校在教學(xué)中也將其作為科學(xué)研究的基本規(guī)范來(lái)傳授。
在大數(shù)據(jù)時(shí)代,這樣的研究方式收到了極大的挑戰(zhàn)。先舉個(gè)事例來(lái)說(shuō)吧。手機(jī)輻射是否能夠致癌?關(guān)于這個(gè)問(wèn)題,無(wú)論我們的假設(shè)如何,實(shí)驗(yàn)的設(shè)計(jì)都很難進(jìn)行。首先,樣本選擇過(guò)少,沒(méi)有統(tǒng)計(jì)學(xué)上的意義;其次,不能拿人做研究對(duì)象;第三,短時(shí)間的研究很難觀察到變化。有了大數(shù)據(jù)之后,這樣的難題就可以迎刃而解了。前段時(shí)間,丹麥就進(jìn)行了這樣的研究。丹麥擁有1985年手機(jī)推出以來(lái)所有手機(jī)用戶(hù)的數(shù)據(jù)庫(kù)。他們從這個(gè)數(shù)據(jù)庫(kù)中分析了1990年至2007年擁有手機(jī)的所用用戶(hù)的數(shù)據(jù),同時(shí),他們還收集了這一期間醫(yī)院收集的所有癌癥患者的數(shù)據(jù),然后分析手機(jī)用戶(hù)是否比非手機(jī)用戶(hù)有更高的癌癥發(fā)病率。這兩個(gè)數(shù)據(jù)庫(kù)本身是完全獨(dú)立的,在作分析之前從來(lái)沒(méi)有想過(guò)可以做這樣的研究。結(jié)果表明,使用移動(dòng)用戶(hù)和癌癥風(fēng)險(xiǎn)增加之間不存在任何關(guān)系。2011年10月,這一研究的結(jié)果發(fā)表在《英國(guó)醫(yī)學(xué)雜志》上。
上述的案例告訴我們,在獲得了大量的數(shù)據(jù),能夠?qū)κ挛锏恼w進(jìn)行全面的認(rèn)識(shí)之后,假想就沒(méi)有意義了,我們可以直接根據(jù)全面的數(shù)據(jù)做出結(jié)論。
大數(shù)據(jù)類(lèi)的.讀書(shū)筆記2
數(shù)據(jù)、技能和思維的整合
粗度大數(shù)據(jù)時(shí)代。作者運(yùn)用豐富的商業(yè)案例為讀者解釋了已經(jīng)到來(lái)的大數(shù)據(jù)時(shí)代的特征,以及存在的種種機(jī)會(huì)。大數(shù)據(jù)的核心是數(shù)據(jù),一切靠數(shù)據(jù)說(shuō)話(huà),這也就決定了大數(shù)據(jù)的最終玩家是掌握數(shù)據(jù)的公司,放眼全球,最有優(yōu)勢(shì)的公司無(wú)疑是谷歌、亞馬遜。對(duì)于中國(guó)來(lái)講,搜索類(lèi)公司百度,電商公司京東、亞馬遜、當(dāng)當(dāng),B2C公司淘寶,社交公司人人、微博、騰訊等。這些公司掌握了大量的數(shù)據(jù),但是究竟能不能做起來(lái)還需要看思維,阿里已經(jīng)成立了研究院,值得看好,百度我還沒(méi)有看到有什么動(dòng)靜,微博現(xiàn)在逐漸沒(méi)落,希望不要步人人網(wǎng)的侯成。
大數(shù)據(jù)將會(huì)是主流,這是和當(dāng)今巨大的數(shù)據(jù)采集、存儲(chǔ)和處理方式?jīng)Q定的,可以說(shuō)大數(shù)據(jù)強(qiáng)調(diào)的相關(guān)關(guān)系為人們快速而準(zhǔn)確的判斷事物的發(fā)展規(guī)律提供了一種全新的思路,這是因?yàn)榫薮蟮臄?shù)據(jù)量,所以相關(guān)關(guān)系才顯得尤為重要。但也存在一個(gè)問(wèn)題,如果只是關(guān)注事物之間的相關(guān)關(guān)系,而忽略了事物之間相關(guān)關(guān)系的內(nèi)在原因,是否會(huì)是功利主義的又一次勝利?是否只是截取社會(huì)規(guī)律涌動(dòng)洪流上的漂亮浪花,而忽略了內(nèi)部真正的推動(dòng)力量?
還有一點(diǎn)疑惑,如果只是從相關(guān)關(guān)系入手,那么得到的都將是已經(jīng)存在的規(guī)律,預(yù)測(cè)的也是將會(huì)發(fā)生的事件,對(duì)于全新的事件將無(wú)法預(yù)測(cè),創(chuàng)新性很難實(shí)現(xiàn)。這也是作者觀點(diǎn)非常不可取的地方。相關(guān)關(guān)系必然很重要,但是因果關(guān)系更加重要,而現(xiàn)在忽略因果關(guān)系的原因我認(rèn)為本質(zhì)上講是商業(yè)社會(huì)的逐利本質(zhì)決定的,人們不可能花費(fèi)大量的時(shí)間、金錢(qián)去探索一些對(duì)自己的利益提升沒(méi)有很大幫助的事情,而相關(guān)關(guān)系恰恰能最大限度的滿(mǎn)足人們快速獲利的動(dòng)機(jī)。
總的來(lái)說(shuō),《大數(shù)據(jù)》這本書(shū)對(duì)于在商業(yè)層面大數(shù)據(jù)的運(yùn)用是很有幫助的,在此基礎(chǔ)上,作者也從基于大數(shù)據(jù)的商業(yè)模式、社會(huì)管理手段以及社會(huì)所面臨的道德問(wèn)題進(jìn)行了簡(jiǎn)單的探討,總的來(lái)說(shuō)從宏觀上把握了已經(jīng)到來(lái)的大數(shù)據(jù)時(shí)代,是一本不錯(cuò)的類(lèi)似讀物,但深度還略顯不足。
我相信大數(shù)據(jù)時(shí)代將給人們的生活帶來(lái)極大地便利以及促進(jìn)整個(gè)社會(huì)資源配置效率的提高,這是大數(shù)據(jù)積極的一方面。但是從我個(gè)人來(lái)講,我不希望大數(shù)據(jù)包含自己生活的方方面面,我需要隱私,更重要的我希望自己能有新的生活軌跡,而不是按照自己之前的軌跡不斷的重復(fù)下去。畢竟,大數(shù)據(jù)時(shí)代所有關(guān)于未來(lái)的預(yù)測(cè)都是基于對(duì)以前的分析。這也是我最擔(dān)心的。
【大數(shù)據(jù)類(lèi)的讀書(shū)筆記】相關(guān)文章:
中文系三大類(lèi)就業(yè)方向11-28
美國(guó)留學(xué)三大類(lèi)獎(jiǎng)學(xué)金申請(qǐng)條件10-21
中國(guó)十大醫(yī)藥類(lèi)大學(xué)排名06-28
關(guān)于面試口語(yǔ)6大類(lèi)問(wèn)題齊分享03-18
中國(guó)十大醫(yī)藥類(lèi)大學(xué)排行榜名單07-04
數(shù)據(jù)庫(kù)開(kāi)題報(bào)告12-21
2017高考專(zhuān)業(yè):管理學(xué)類(lèi)六大熱門(mén)專(zhuān)業(yè)06-19