- Bước 1- xác định blogspot cần lấy phải thỏa mãn điều kiện rss của nó phải là rss full, rss không bật full thì chỉ lấy phần giới thiệu
- Để xác định rss là full hay không chỉ cần đánh tên địa chỉ web như sau vào :
http://diachi.blogspot.com/atom.xml
Thay: diachi thành tên blog cần lấy
Ví dụ: http://mrhpvn.blogspot.com/atom.xml
(Tất nhiên sau sự cos mất cawops mình đã fix lại rồi nên các bạn đừng thắc mắc tại sao chỉ có phần trích dẫn nha).- Nếu rss được bật full thì ta có thể lấy toàn bộ data. còn không thì dừng ở đây được rồi. Có một số template yêu cầu bắt buộc phải bật full rss như template Simplex Celebrity .... các trang tin hot teen hay dùng lắm, và một số Blogger mới vào nghề chưa biết hay quyên.
- Bước 2: Xác định tổng số bài viết có trong blogspot đó bằng cách tạo một bài viết mới và Pate co bên dưới vào phần html:
<script style="text/javascript">Thay: mrhpvn.blogspot.com bằng tên blog bạn cần khi đó sẽ hiển thị số bài đăng như sau:
function showpostcount(json) {
document.write('<center>Tổng số bài: <b>' + parseInt(json.feed.openSearch$totalResults.$t,10)
+ '</b></center>');}</script>
<script src="http://mrhpvn.blogspot.com/feeds/posts/default?alt=json-in-script&callback=showpostcount"></script>
<script style="text/javascript"></script>
Cần xác định số bài đăng vì vì 1 số blogspot khủng data > 10000 bài nên sẽ chia nhỏ thành các đoạn data ,sau đó lấy theo khỏang từ 1-50 bài hay 1-10 bài tùy đường truyền mạng hay cấu hình máy. Blogspot cho import tối đa 500 bài.
- Bước 3: copy và paste đoạn cần lấy vào chương trình download IDM khi đó sẽ là nếu máy ai chưa cài IDm có thể download TẠI ĐÂY. Ví dụ đoạn link dưới đây là lấy từ bài 1 đến bài 10 kể từ bài đăng mới nhất.
http://diachi.blogspot.com/atom.xml?redirect=false&start-index=1&max-results=10
Trong đó:
- start-index=1 bắt đầu bài đăng mới nhất
- max-result=10 lấy từ bài 1 đến bài thứ 10
- diachi.blogspot.com: là blog cần lấy Data
http://diachi.blogspot.com/atom.xml?redirect=false&start-index=11&max-results=10
http://diachi.blogspot.com/atom.xml?redirect=false&start-index=21&max-results=10
..................................
- Sau đó ta thu được các file .xml (chuẩn rss hình như wordpress cũng cho phép import rss vào- chưa thử )- Bước 4: Import file xml đó vào blogspot bằng cách vào Setting ( Cài đặt ) -> Import. done ( Nhập Blog ) - Chỉ đường dẫn tới các file .XML mà bạn vừa download về.
-chú ý : khi import xong nên đăng lấy lệ 1 vài bài để xóa bỏ capchar khi import quá nhiều bài 1 lúc, google săm soi blog sẽ cho là spam sẽ disable acc .
P/s by mrhpvn: tránh cho blog của bạn bằng cách tắt chức năng full này đi bằng cách vào Setting ( Cài đặt ) -> Nguồn cấp dữ liệu trang Web -> tại mục Cho phép nguồn cấp dữ liệu Blog bạn chọn Cho đến dấu ngắt .
Nếu template bắt buộc đặt full thì ta nên tạo thêm 1 đoạn giới thiệu ,để khi bài được mang vác khắp nơi người đọc biết nguồn xuất phát từ đâu khi có ai dùng( 1 số hay quên ghi tác giả như mình đây)
Chúc các bạn ngăn chặn hiệu quả!
Share your views...
0 Respones to "Lấy dữ liệu Blogspot khác và Bảo vệ dữ liệu blogspot bản thân."
Đăng nhận xét