做數(shù)據(jù)分析,沒有數(shù)據(jù),是分析師的硬傷。但不完全是硬傷,沒有數(shù)據(jù)其實(shí)也可以利用邏輯思維能力來分析推斷,這個(gè)以后有機(jī)會(huì)跟大家分享。今天,我要講怎么用代碼獲取數(shù)據(jù)。
沒辦法很詳細(xì)地講,只能大致上講解一下,然后給個(gè)實(shí)例。
工具:Excel2013(用哪個(gè)版本都是可以的)
語言:Visual Basic for Applications(簡(jiǎn)稱VBA,集成在Office套件里面的開發(fā)程式,有些精簡(jiǎn)版或者用戶在安裝的時(shí)候取消了VBA套件,就會(huì)無法啟動(dòng))
我原本學(xué)的是硬件開發(fā),只會(huì)匯編,寫這類程序不是我擅長(zhǎng)的,而且是自學(xué)的只有半桶水的狀態(tài)。我寫的程序都有很大的優(yōu)化空間,如果有更高效的方法,請(qǐng)不吝指教。
實(shí)例一:獲取淘寶搜索結(jié)果頁寶貝信息
如下圖,搜索了關(guān)鍵詞“T恤”后,會(huì)看到類似這樣的結(jié)果,我想把寶貝標(biāo)題和價(jià)格,排名位置等信息給抓取到本地?cái)?shù)據(jù)庫(kù)或者表格里面。
我們右擊一下頁面,點(diǎn)查看源文件
看到的結(jié)果如下
這個(gè)是網(wǎng)頁源碼,我要介紹的方法,就是通過網(wǎng)頁請(qǐng)求,獲取這里的源碼,然后再對(duì)源碼進(jìn)行解析。
觀察源碼這個(gè)步驟很重要,在這里會(huì)決定數(shù)據(jù)要怎么拿。
比如要取出標(biāo)題
標(biāo)題是在 title= 后面的一串字符,又以 > 符號(hào)結(jié)束。把這兩個(gè)看成是分隔符的話,那么標(biāo)題就藏在兩個(gè)分隔符的中間。
那么,思路上,只要知道這兩個(gè)分割符的位置,那么,就可以取出標(biāo)題了。
樂發(fā)網(wǎng)超市批發(fā)網(wǎng)提供超市貨源信息,超市采購(gòu)進(jìn)貨渠道。超市進(jìn)貨網(wǎng)提供成都食品批發(fā),日用百貨批發(fā)信息、微信淘寶網(wǎng)店超市采購(gòu)信息和超市加盟信息.打造國(guó)內(nèi)超市采購(gòu)商與批發(fā)市場(chǎng)供應(yīng)廠商搭建網(wǎng)上批發(fā)市場(chǎng)平臺(tái),是全國(guó)批發(fā)市場(chǎng)行業(yè)中電子商務(wù)權(quán)威性網(wǎng)站。
本文內(nèi)容整合網(wǎng)站:百度百科、知乎、淘寶平臺(tái)規(guī)則