🌿 Diễn Đàn Công Nghệ Dầu Khí
Đăng nhập · Đăng ký
  1. Trang Chủ
  2. Liên kết hay
  3. Tìm Kiếm Và Khai Thác Thông Tin Trên Int

Tìm Kiếm Và Khai Thác Thông Tin Trên Internet.

trong Liên kết hay · 15801 xem · 46 trả lời

seuluneQuản Trị
Bài: 118
+0 uy tín
07/11/2005
#2122/01/2008
damquangquy' date='Jan 16 2008, 09:57 AM' viết: Bác thử tìm xem có cách nào down đc ebook trên book.google ko .


Uhm, theo mình được biết thì hiện nay trên net có chỉ 2 cách để load sách từ Google Book về. Tuy nhiên mình đã test thì thấy kết quả ko được tốt, chỉ load về được một ít, chưa lấy hết được. Nếu bạn có nhu cầu thì mình sẽ post lên tham khảo, nếu ko thì cứ để từ từ, mình nghiên cứu xem còn cách nào ko. Anh em ai có cách load hết thì tham gia nha.
seuluneQuản Trị
Bài: 118
+0 uy tín
07/11/2005
#2222/01/2008
Mình xin post tiếp cách down sách ở một số site cho đủ bộ.

Download sách ở Wiley (www.wiley.interscience.com)

- Chạy OEE, login vào Wiley (paste cái link Wiley vào Internal Browser chứ chỉ click vào là nó nhảy ra IE đấy), mở quyển sách cần lấy ra (đến chỗ hiện danh mục chapter). Chỉ mouse vào mấy chữ pdf dưới các chapter sẽ thấy các link của các chương:

🔒 Bấm Cảm ơn hoặc Trả lời để xem Link

....

🔒 Bấm Cảm ơn hoặc Trả lời để xem Link

Để ý xem số lớn nhất và nhỏ nhất là bao nhiêu.

- Sau đó mở một chương bất kỳ (phải nhập email và pass).

- Sau đó chọn File\New\Project:

+ Name: đặt tên gì cũng được

+ Addresses (URLs): gõ:

🔒 Bấm Cảm ơn hoặc Trả lời để xem Link :8080/cgi-bin/confirmaccess?ID={:110505514..110505531}&Act=2138& GRP=PDFSTART

+ Level Limit: đặt = 0

+ Click OK để Save project.

- Trong cửa sổ phía trên bên trái, right click vào project rồi chọn Download\Start.

- Đợi download xong rồi chọn File\Export để Export project.

(*) Note:

Nếu các bạn đã có acc từ các thư viện có thuê sách của Wiley, các bạn nên đăng ký một acc rồi Active Roaming Access để đề phòng thằng EZ chết.

Download cực nhanh ở Science Direct

Nếu bạn chán ngán cảnh load từng bài báo ở SD, bạn có thể làm cách sau:

Cài FireFox và extension DownThemAll (https://addons.mozilla.org/firefox/201/)

- Chạy FireFox

- Vào menu Tools\DownThemAll\Preferences..., set If a filename already exits thành Rename

- Login vào ScienceDirect và search bài báo với từ khoá thích hợp (ô search nằm ở phía trên bên trái)

- Khi list các bài báo hiện ra thì vào menu Tools\DownThemAll\DownThemAll!...

- Click Additional filters rồi gõ pdf vào ô bên dưới

- Click Start để download.

Với cách này bạn có thể download hàng trăm bài báo đúng chủ đề mình cần cùng một lúc mà rất nhanh và đơn giản.

____________________(còn tiếp)____________________
damquangquyQuản Trị
Bài: 781
+7 uy tín
03/10/2007
#2322/01/2008
Với cách như trên để down trên Science Direct thì thằng IDM sẽ tự bắt link và nó sẽ không tự rename mà mình lại pải làm thủ công .Em cũng đã áp dụng rồi thấy không hiệu quả mấy.

Em có cách này.Kicks chuột pải vào chữ PDF của 1 bài báo bất kỳ >chọn Download all links with IDM.

Sau đó nó sẽ hiện lên 1 cái bảng,các bạn tich hết vào các ô có biểu tượng của file PDF,>ok

vào IDM resume la ok.
seuluneQuản Trị
Bài: 118
+0 uy tín
07/11/2005
#2423/01/2008
damquangquy' date='Jan 22 2008, 02:53 PM' viết: Với cách như trên để down trên Science Direct thì thằng IDM sẽ tự bắt link và nó sẽ không tự rename mà mình lại pải làm thủ công .Em cũng đã áp dụng rồi thấy không hiệu quả mấy.

Em có cách này.Kicks chuột pải vào chữ PDF của 1 bài báo bất kỳ >chọn Download all links with IDM.

Sau đó nó sẽ hiện lên 1 cái bảng,các bạn tich hết vào các ô có biểu tượng của file PDF,>ok

vào IDM resume la ok.


Thực chất thì DownThemAll là một Add-on hỗ trợ quá trình download khi duyệt web bằng FF. Nếu bạn không muốn IDM "dành" phần download của DownThemAll thì bạn tắt chức năng tự động down của IDM đi. Ngoài ra thì làm như bạn damquangquy cũng là một cách rất hay. 🔒 Bấm Cảm ơn hoặc Trả lời để xem Link[1].gif" alt="" class="bb-img" loading="lazy"> .Mong các bạn tiếp tục ủng hộ & góp ý 🔒 Bấm Cảm ơn hoặc Trả lời để xem Link[1].gif" alt="" class="bb-img" loading="lazy">
huutuanThành Viên
Bài: 179
+0 uy tín
17/02/2008
#2518/02/2008
Cảm ơn Bác.em cũng là dân biết chút ít về tin học mà đọc bài cùa Bác em thấy mình non kém quá.Mong Bác sẽ tiếp tục phát huy đễ giúp đỡ anh em.
seuluneQuản Trị
Bài: 118
+0 uy tín
07/11/2005
#2619/02/2008
damquangquy' date='Jan 16 2008, 09:57 AM' viết:Bác thử tìm xem có cách nào down đc ebook trên book.google ko .


Mình vừa tìm được một hướng dẫn load sách từ google books, test cũng thấy có hiệu quả nên post lên cho bà con ngâm cứu:

* Hướng dẫn download từ google books và tạo file pdf từ image:

1. Cái này chỉ dùng được với Firefox, do đó bạn phải cài FF từ đây:🔒 Bấm Cảm ơn hoặc Trả lời để xem Link

2. Cài thêm một Add on hỗ trợ: ScrapBook. Bạn có thể tìm thấy ScrapBook ở đây: 🔒 Bấm Cảm ơn hoặc Trả lời để xem Link

Sau khi cài đặt SB, bạn vào phần options của nó trong Tools/Add-on/ScrapBook.

Trong thẻ Organise của SB option, bạn chọn đường dẫn để lưu các file ảnh sẽ được load về.

3. Download phần mềm tạo file pdf từ các file ảnh: image2pdf

4. Bi h bạn đã có thể "vặt lông" Google Books. Vào GB, tìm cuốn sách bạn cần, chờ cho load xong tất cả các trang (image) của sách, xong bạn click ScrapBook/Capture Page. Tìm các file mà ScrapBook load về. Các file sách load về có đuôi là .dat, bạn chỉ cần giữ lại các file có đuôi là .dat, các file ko cần thiết thì bạn xóa đi.

5. Đổi tên cho các file trên sang dạng .gif

6. Kiểm tra từng file và xóa các file ảnh ko cần thiết.

7. Tạo file pdf từ các images trên với phần mềm Image2Pdf.

Chúc thành công. 🔒 Bấm Cảm ơn hoặc Trả lời để xem Link[1].gif" alt="" class="bb-img" loading="lazy">
damquangquyQuản Trị
Bài: 781
+7 uy tín
03/10/2007
#2719/02/2008 (đã sửa)
Cách này hay và đc lắm anh ah.

Chỉ tiếc là chữ hơi bị mờ một chút.

KO bít có chương trình nào đổi tên mở rộng của file hàng loạt ko??

Nếu đổi thủ công như thế này thì 🔒 Bấm Cảm ơn hoặc Trả lời để xem Link[1].gif" alt="" class="bb-img" loading="lazy">
huutuanThành Viên
Bài: 179
+0 uy tín
17/02/2008
#2825/02/2008
em đã thử rồi nhưng cách này cũng chỉ down được 1 số trang thôi.mong các bác tìm ra cách khác.
damquangquyQuản Trị
Bài: 781
+7 uy tín
03/10/2007
#2925/02/2008
huutuan' date='Feb 25 2008, 11:40 AM' viết: em đã thử rồi nhưng cách này cũng chỉ down được 1 số trang thôi.mong các bác tìm ra cách khác.


hiện tại thì chưa có cách nào down đc trọn ven j ebook trên google đâu bạn ah.Chỉ có thể down dc các trang mà nó cho đọc online là may mắn lắm rồi.

Tuy nhiên ko pải google là tất cả mà chỉ đơn giản là dẽ kiếm thôi,còn rất nhiều site share nữa nhưng chỉ tiếc là chưa tìm ra hihi.
seuluneQuản Trị
Bài: 118
+0 uy tín
07/11/2005
#3025/02/2008
damquangquy' date='Feb 19 2008, 02:38 PM' viết: KO bít có chương trình nào đổi tên mở rộng của file hàng loạt ko??

Nếu đổi thủ công như thế này thì 🔒 Bấm Cảm ơn hoặc Trả lời để xem Link[1].gif" alt="" class="bb-img" loading="lazy">


Quý ơi, trên mạng có nhiều phần mềm giúp đổi tên file hàng loạt lắm, Quý hỏi Google thì có ngay ấy mà.

Còn không thì bạn có thể dùng phần mềm này cũng được: Lupas rename

Ưu điểm của Lupas rename🔒 Bấm Cảm ơn hoặc Trả lời để xem Link[1].gif" alt="" class="bb-img" loading="lazy">

1. Rất dễ sử dụng.

2. Đổi hàng loạt bất cứ tên của tập tin hay thư mục nào.

3. Có thể tùy ý biến đổi tên theo ý muốn mà vẫn giữ lại tên gốc của file.

4. Thay đổi cả phần mở rộng của file.

5. Tự động điền số vào tên file (Autonumber)

6. Nếu muốn, bạn có thể tạo một tập tin *.bat để có thể lưu lại các thay đổi, sau này dùng lại.

Chúc bạn thành công.

Ah quên, bạn có thể tải Lupas rename tại đây: ----> 🔒 Bấm Cảm ơn hoặc Trả lời để xem Link
tech_oilgasQuản Trị
Bài: 379
+0 uy tín
06/08/2007
#3125/02/2008
Selune đúng là pro thật. Cố gắng phát huy nha! Thanks nhiều.
seuluneQuản Trị
Bài: 118
+0 uy tín
07/11/2005
#3226/02/2008
Ở các bài trên, mình đã hướng dẫn các bạn cách tìm Acc của Ezproxy của các trường đại học để tải tài liệu từ ScienceDirect và các site khác. Ngoài ra, các bạn có thể tiếp cận các site đó thông qua Proxy. Giới thiệu chung về Proxy chắc mình phải viết trong 1 bài khác, ở đây, mình chỉ tập trung vào khía cạnh khai thác các site trên thông qua việc thay đổi Proxy.

Truy cập và tải tài liệu từ ScienceDirect qua Proxy

1. Cái này chỉ thực hiện trên FireFox, do đó các bạn download FF về và cài đặt vào máy.

2. Chạy FF, sau đó bạn cài Add-on hỗ trợ: SwitchProxy Tool 1.4.1. Bạn có thể down về từ địa chỉ này: 🔒 Bấm Cảm ơn hoặc Trả lời để xem Link

3. Sau khi cài đặt xong SwitchProxy, Restart lại FF, bạn sẽ thấy xuất hiện 1 thanh Toolbar mới: Switch Proxy ToolBar.



4. Xong phần cài đặt, bi h ta sẽ bắt đầu dùng Proxy thông qua Switch Proxy.

(a) Trước hết, bạn cần phải tìm các Proxy có thể cho truy cập vào SD. Điều này dễ thôi, mình sẽ viết 1 bài khác về cách tìm Proxy sau. Bi h mình sẽ cung cấp cho các bạn một số cái dùng tạm (nhớ đừng lạm dụng, để nó sống thọ một tý 🔒 Bấm Cảm ơn hoặc Trả lời để xem Link[1].gif" alt="" class="bb-img" loading="lazy"> )

Bạn có thể dùng mấy cái này: 152.3.138.4:3124 (MIT Library), 62.93.33.52:3128 (Rzeszow University)

(🔒 Bấm Cảm ơn hoặc Trả lời để xem Link[1].gif" alt="" class="bb-img" loading="lazy"> Click "Add" trên Switch Proxy



Click "Next"



© Điền thông tin vào trong Proxy Info:

Ví dụ với MIT Library 152.3.138.4:3124

Bạn điền các thông tin:

- Proxy Label: Tùy ý bạn (mình đặt là SD Proxy 1)

- HTTP Proxy: 152.3.138.4 Port: 3124

Xong, click "OK", vậy là bạn đã Add được một Proxy vào SwitchProxy.

Tiếp tục lập lại các bước trên, bạn lần lượt Add tất cả các Proxy tìm được vào SwitchProxy.

5. Bi h chúng ta sẽ sử dụng các Proxy để down các bài báo từ SD:

(a) Chọn lấy một Proxy từ Switch Proxy, ở đây mình chọn SD proxy 2:



Click "Apply", khi đó bạn sẽ thấy:

🔒 Bấm Cảm ơn hoặc Trả lời để xem Link[1].gif" alt="" class="bb-img" loading="lazy"> Mở trang 🔒 Bấm Cảm ơn hoặc Trả lời để xem Link và bạn đã có thể load các bài báo rồi đấy.

Chú ý: Bằng cách trên, bạn có thể download các bài báo, tuy nhiên, tốc độ down có thể sẽ rất chậm, bạn hãy thoát ra khỏi Proxy đó, trở về trạng thái bình thường thì tốc độ down sẽ nhanh hơn và bảo vệ Proxy khỏi tổn thọ (Proxy đó sẽ không bị chú ý là down quá nhiều)

Chúc thành công.
damquangquyQuản Trị
Bài: 781
+7 uy tín
03/10/2007
#3326/02/2008
Bài này hay lắm anh ah,

Ah em hỏi tý, ngoài kho dữ liệu SD thì còn có thể vào các kho dữ liệu khác của Proxy này ko và bằng cách nào có thể vào đc hả anh.
seuluneQuản Trị
Bài: 118
+0 uy tín
07/11/2005
#3427/02/2008
damquangquy' date='Feb 26 2008, 01:12 PM' viết: Ah em hỏi tý, ngoài kho dữ liệu SD thì còn có thể vào các kho dữ liệu khác của Proxy này ko và bằng cách nào có thể vào đc hả anh.


Như mình đã nói ở bài đầu tiên, đây là một trong các cách mà các máy tính bên ngoài truy cập vào máy chủ trong các trường đại học để thông qua đó mà tới các thư viện trực tuyến mà trường đó đã thuê cho sinh viên sử dụng. Do đó nếu như trường đại học đó thuê cơ sở dữ liệu nào thì bạn đều có thể sử dụng được hết. Bạn lại nhờ anh chàng Google tìm địa chỉ trường đó, vào thư viện và tìm các cơ sở dữ liệu liên kết.

Còn muốn biết Proxy bạn vừa sử dụng của trường nào ư? Hi hi, trong Science Direct, trên đầu trang có ghi rõ: "Bought you by...................". Ngoài ra, bạn có thể biết chính xác hơn bằng cách sử dụng cách này:

1, Mở trang web: 🔒 Bấm Cảm ơn hoặc Trả lời để xem Link

2, Điền Proxy vào SmartWhois



----------> bạn sẽ có thông tin bạn cần.

Chúc vui vẻ.
oilmanThành Viên
Bài: 358
+0 uy tín
12/03/2006
#3527/02/2008
vote cho seluem điểm 10 chất lượng vì sự nhiệt tình, việc bạn làm giúp nguồn tài liệu của người khác thêm phong phú, thanks 🔒 Bấm Cảm ơn hoặc Trả lời để xem Link[1].gif" alt="" class="bb-img" loading="lazy">
HelperThành Viên
Bài: 43
+0 uy tín
02/10/2007
#3629/02/2008
Cảm ơn bạn Seulune nhiều. Thanks again.
seuluneQuản Trị
Bài: 118
+0 uy tín
07/11/2005
#3702/03/2008
@ oilman, Helper: Thanks các bạn đã ủng hộ
seuluneQuản Trị
Bài: 118
+0 uy tín
07/11/2005
#3802/03/2008
Ở các bài trước mình đã giới thiệu các bạn cách để truy cập vào cơ sở dữ liệu của các trường đại học thông qua ezproxy và thay đổi proxy. Chúng ta có thể tìm được các Acc Ezproxy hoặc các proxy của các trường đại học bằng cách tham gia vào các diễn đàn hoặc tìm trong các blog. Sau đây mình sẽ hướng dẫn các bạn tự crack một poxy cho riêng mình.

Trước hết mình xin giới thiệu một tý về CoDeeN:

* CoDeeN hay Content Distribution Network là một hệ thống các Proxy được trường đại học Princeton xây dựng và phát triển. Nguyên tắc hoạt động của CoDeeN là tập trung nhiều nút mạng có thể trao đổi dữ liệu cho nhau một cách nhanh chóng. Các nút mạng đó hoạt động tương hỗ với nhau do đó chúng có thể đáp ứng các yêu cầu từ các địa chỉ IP khác nhau một cách nhanh chóng.

Nếu các bạn muốn tìm hiểu kỹ hơn về CoDeeN, bạn có thể search trên Google.

Trở lại với vấn đề của chúng ta, hiện nay, ngoài việc truy cập trực tiếp vào các trang web như SD, Wiley, NetLibrary... các trường đại học có thể thông qua CoDeeN, đặt ra một loạt các nút, qua đó dễ dàng cho việc truy cập vào các thư viện trên và dễ ...hack.

Bây giờ mình sẽ hướng dẫn các bạn làm thế nào để có thể tải được tài liệu thông qua CoDeeN:

1, Đầu tiên, bạn phải tìm một proxy CoDeeN tại địa chỉ này: 🔒 Bấm Cảm ơn hoặc Trả lời để xem Link

2, Bạn phải chọn các Proxy còn sống, các Proxy "Good", đừng chọn các Proxy đã bị khóa ở các cổng 3124, 3127, 3128

🔒 Bấm Cảm ơn hoặc Trả lời để xem Link . Tìm thêm các thông tin về Proxy vừa chọn:



Ta có thể thấy kết quả:



4, Chuyển Proxy của bạn sang cái mới tìm được. Chú ý điền cổng (Port) cho chính xác.

Thông thường, các Port sử dụng là 3124, 3127, 3128, 8080... Nếu bạn thử các cổng ấy không được thì có thể sử dụng công cụ sau để tìm chính xác: Proxy Hunter 3.1

Down Proxy Hunter 3.1 tại đây: 🔒 Bấm Cảm ơn hoặc Trả lời để xem Link

5, Sau khi thay đổi Proxy, bạn có thể vào download một cách dễ dàng từ SD, Wiley...

Note:

Đây là địa chỉ một số cơ sở dữ liệu lớn:

🔒 Bấm Cảm ơn hoặc Trả lời để xem Link ==== science.adsense-seo.net

🔒 Bấm Cảm ơn hoặc Trả lời để xem Link ==== ieee.adsense-seo.net

🔒 Bấm Cảm ơn hoặc Trả lời để xem Link ==== proquest.adsense-seo.net

🔒 Bấm Cảm ơn hoặc Trả lời để xem Link ==== ovid.adsense-seo.net

🔒 Bấm Cảm ơn hoặc Trả lời để xem Link ==== spring.adsense-seo.net

NetLibrary ==== NetLibrary.adsense-seo.net

Wiley ==== wiley.adsense-seo.net

Chúc thành công. 🔒 Bấm Cảm ơn hoặc Trả lời để xem Link[1].gif" alt="" class="bb-img" loading="lazy">
RubiThành Viên
Bài: 55
+0 uy tín
22/08/2007
#3905/03/2008
Cộng đồng dầu khí ơi giúp mình với!

Mình dag tìm hiểu về quá trình ACR(advanced cracking process),làm thế nào để tìm được các tài liệu với các thông tin sau:

1. J.A.Bonnilla and J.D.Elliott.US.patent 4.686.027 date 11/8/1987

2. J.Bonilla,Energy process,5,(4).12/1985

3. Michael J.McGrath and John D.Elliot.Foster Wheeler USA corporation,Paper prensented at the PACHE'88 Congress,Acapulco,Mexico,10/1988
damquangquyQuản Trị
Bài: 781
+7 uy tín
03/10/2007
#4005/03/2008
Rubi' date='Mar 5 2008, 09:59 PM' viết: Cộng đồng dầu khí ơi giúp mình với!

Mình dag tìm hiểu về quá trình ACR(advanced cracking process),làm thế nào để tìm được các tài liệu với các thông tin sau:

1. J.A.Bonnilla and J.D.Elliott.US.patent 4.686.027 date 11/8/1987

2. J.Bonilla,Energy process,5,(4).12/1985

3. Michael J.McGrath and John D.Elliot.Foster Wheeler USA corporation,Paper prensented at the PACHE'88 Congress,Acapulco,Mexico,10/1988


Hic như này thì đúng là bo tay thật

không có 1 chút gì để dùng làm từ khóa mà search cả

MÀ từ advanced nó lại đối lập với những con số 11/8/1987- 12/1985....
Vui lòng đăng nhập để trả lời.