查看完整版本: VB6 如何讀取網頁裡的文字
頁: [1] 2

z9592447 發表於 2014-5-30 01:52 PM

VB6 如何讀取網頁裡的文字

請問怎麼讀取下面這個網址下載那邊的文字
http://pan.baidu.com/s/1eQosYyQ#dir/path=%2Fapps%2F%E3%82%A4%E3%82%B1%E3%81%A6%E3%82%8B2%E4%BA%BA
我在原始碼裡完全找不到那個框框裡面的文字...

<div></div>

sam30525sam 發表於 2014-5-30 04:00 PM

本帖最後由 sam30525sam 於 2014-5-30 04:00 PM 編輯

你應該說明你是怎麼抓原始碼的,
如果你是 滑鼠右鍵>檢視原始碼 ,那我不太知道要怎麼跟你講這東西…

你如果可以說得更詳細你怎麼抓的,才可以給你幫助,
不然方法有很多,要解決的問題點更多。

順帶一提,如果你是要做下載器的話,
建議你先從基本的做起,找個小網站抓抓看,
不然一下子做這個你會很灰心。...<div class='locked'><em>瀏覽完整內容,請先 <a href='member.php?mod=register'>註冊</a> 或 <a href='javascript:;' onclick="lsSubmit()">登入會員</a></em></div>

z9592447 發表於 2014-5-30 04:36 PM

我是想用WebBrowser這一個控建抓取下載框框那裡面的文字而已
但是不知道要怎麼抓....
還有我抓文字不是要做下載器
是有其他的用途....

sam30525sam 發表於 2014-5-30 04:45 PM

本帖最後由 sam30525sam 於 2014-5-30 06:31 PM 編輯

z9592447 發表於 2014-5-30 04:36 PM static/image/common/back.gif
我是想用WebBrowser這一個控建抓取下載框框那裡面的文字而已
但是不知道要怎麼抓....
還有我抓文字不是要做 ...
你這發言跟你原本的問題有牴觸,
WebBrowser應該有含所有的頁面的原始碼,
因為他是調用IE出來做的,不太可能會有抓不到的頁面,
你看到什麼,WebBrowser就有什麼。

所以你的問題點不是開帖的「沒有這段文字」,而是你3F的「不知道怎麼抓這段文字」,
這兩個差很多。

怎麼抓做法也有很多,但通常比較常用的是利用標籤或id去抓,
用標籤或id怎麼抓你可以google。

麻煩參考以下網址
利用WebBrowser去抓取原始碼的值
C# WebBrowser抓取HTML原始碼與AJAX動態產生的內容...<div class='locked'><em>瀏覽完整內容,請先 <a href='member.php?mod=register'>註冊</a> 或 <a href='javascript:;' onclick="lsSubmit()">登入會員</a></em></div>

z9592447 發表於 2014-5-30 05:45 PM

本帖最後由 z9592447 於 2014-5-30 05:46 PM 編輯

抱歉3F 意思打錯了 是找不到這段文字才對
還有你可以自己去看看原始碼真的沒有下載那邊的文字.... 只有框框外面的原始碼...
還有我忘記說了我是用VB6
<br><br><br><br><br><div></div>

sam30525sam 發表於 2014-5-30 06:15 PM

本帖最後由 sam30525sam 於 2014-5-30 06:30 PM 編輯

z9592447 發表於 2014-5-30 05:45 PM static/image/common/back.gif
抱歉3F 意思打錯了 是找不到這段文字才對
還有你可以自己去看看原始碼真的沒有下載那邊的文字.... 只有框框 ...
不對,
我說過「你看到什麼,WebBrowser就有什麼。」。
除非你今天沒裝IE,如果沒裝IE連WebBrowser都不能用,
因為WebBrowser就是調用IE來做的,
你今天IE看的到的東西WebBrowser一定有,
如果沒有,那你IE一定看不到。

問這樣子好了,你的原始碼是怎麼看到的?
是滑鼠右鍵,還是WebBrowser的Document相關?

你應該要把抓取網頁原始碼那段程式碼PO上來,
不然怎麼知道你問題出在哪邊?

...<div class='locked'><em>瀏覽完整內容,請先 <a href='member.php?mod=register'>註冊</a> 或 <a href='javascript:;' onclick="lsSubmit()">登入會員</a></em></div>

z9592447 發表於 2014-5-30 06:22 PM

本帖最後由 z9592447 於 2014-5-30 06:34 PM 編輯

這是我用瀏覽器抓的原始碼  
不是控建的
控建的我還不知道怎麼抓...

sam30525sam 發表於 2014-5-30 06:27 PM

本帖最後由 sam30525sam 於 2014-5-30 06:31 PM 編輯

z9592447 發表於 2014-5-30 06:22 PM static/image/common/back.gif
這是我用瀏覽器抓的原始碼  
不是控建的
控建的我還不知道怎麼抓...

你先把PO的網頁原始碼刪一刪,有點礙眼。

所以說,你是滑鼠右鍵看到的網頁原始碼,
不是用WebBrowser。

你的問題在於,你不會用WebBrowser…
我只能跟你講,WebBrowser有你要的,一定有,但怎麼抓是另一回事。

我建議你google或買個入門書,
因為這個牽扯到不只WebBrowser,還有網頁架構等等,
我要是仔細回答你我就可以出書了。

怎麼抓還是我最上面說的,用標籤或id去抓,這個已經是最能夠符合你要的答案了,
詳細的做法就真的你要自己去查google或者買書了。

...<div class='locked'><em>瀏覽完整內容,請先 <a href='member.php?mod=register'>註冊</a> 或 <a href='javascript:;' onclick="lsSubmit()">登入會員</a></em></div>

z9592447 發表於 2014-5-30 06:37 PM

本帖最後由 z9592447 於 2014-5-30 06:38 PM 編輯

其實我是有另1個方法
WebBrowser1.ExecWB OLECMDID_SELECTALL, OLECMDEXECOPT_DONTPROMPTUSER ' 全選
WebBrowser1.ExecWB OLECMDID_COPY, OLECMDEXECOPT_DONTPROMPTUSER ' 複製
但是那個下載區裡面的東西太多的話就沒辦法完全抓到了
所以我才想看可不可以直接抓下載區裡面的文字.

sam30525sam 發表於 2014-5-30 09:53 PM

本帖最後由 sam30525sam 於 2014-5-30 10:35 PM 編輯

z9592447 發表於 2014-5-30 06:37 PM static/image/common/back.gif
其實我是有另1個方法

但是那個下載區裡面的東西太多的話就沒辦法完全抓到了

痾~我還是那句話,
你IE看到什麼,WebBrowser就有什麼。

如果你剛開始摸WebBrowser,可以把它想像成它就是IE,
它不是控制項,是有很多其他功能的IE,

如果你說東西太多無法完全抓到,
你這時候應該打開IE看看是不是有那個東西在,
有的話代表你抓的方式錯誤,
沒有的話代表你還要再進一步處理。

另外,
也沒有辦法「直接抓文字」這種動作,
WebBrowser本身就是有全部頁面的網頁原始碼,
你必須要分析拆解才可以抓到,有點像是在剝洋蔥一樣一個一個拆,
而且每個網站都不同,都必須個別拆,更不用提會遇到其他問題要解決。

你如果用IE,請開啟該網頁,按下F12,
如果用Chome就滑鼠右鍵>...<div class='locked'><em>瀏覽完整內容,請先 <a href='member.php?mod=register'>註冊</a> 或 <a href='javascript:;' onclick="lsSubmit()">登入會員</a></em></div><br><br><br><br><br><div></div>

z9592447 發表於 2014-5-30 10:49 PM

謝謝大大的指導我會在上網查看看的~~

darkjack 發表於 2014-5-31 09:38 PM

稍微看了一下..你真的很會挑...挑了百度芸....
那個網址啥米的都算是動態生成的..也就是你滑鼠移動到那邊才會生成一個網頁碼...

webbrowser 控件內取得的網頁原始碼有可能找不到那段的

sam30525sam 發表於 2014-5-31 11:47 PM

darkjack 發表於 2014-5-31 09:38 PM static/image/common/back.gif
稍微看了一下..你真的很會挑...挑了百度芸....
那個網址啥米的都算是動態生成的..也就是你滑鼠移動到那邊才 ...

可以喔,我就抓過了。

WebBrowser就是調用IE,
IE會出現的內容WebBrowser就有。

如果你說用WebClient或HttpWebResponse我還會相信。
但只要經過處理,我說的這些方法其實都可以抓的到。
...<div class='locked'><em>瀏覽完整內容,請先 <a href='member.php?mod=register'>註冊</a> 或 <a href='javascript:;' onclick="lsSubmit()">登入會員</a></em></div>

darkjack 發表於 2014-6-1 06:17 PM

sam30525sam 發表於 2014-5-31 11:47 PM static/image/common/back.gif
可以喔,我就抓過了。

WebBrowser就是調用IE,


IE 有什麼webbrowser  是沒錯
但是如果按下F12 跳出視窗...有的根本原始碼內找不到

darkjack 發表於 2014-6-5 08:13 PM

最典型的...youtube 網站



還有本站 的影片區





我標藍字...就是 用


網頁下的 檢視原始碼去做搜尋..找不到該文字段
<br><br><br><br><br><div></div>
頁: [1] 2