Sebelumnya, saya ingin menegaskan bawa tulisan saya ini hanya untuk pembelajaran semata. dengan script PHP, Curl dan Batch File ini saya mengambil konten blog http://topnew-gadget.blogspot.com dan langsung saya posting ke sebuah blog dengan engine wordpress dengan memanfaatkan fitur Remote Publishingnya.
Pada contoh ini saya menggunakan server lokal apache2triad dan untuk koneksi Internet tidak menggunakan proxy.
Jika anda ingin mencobanya, berikut ini cara yang saya pergunakan :
- Enable setting XMLPRC Worpress.
Masuk ke halaman WP-Admin dan aktifkan Remote Publishing Wordpress yang akan menampung postingan dari web target dari menu : setting –> Writing –> Remote Publishing –> cek Enable the WordPress, Movable Type, MetaWeblog and Blogger XML-RPC publishing protocols.
- Download scriptnya di http://www.mediafire.com/?b222oes0wnt5h8d
- Extract file ke htdocs sehingga terdapat sebuah folder mycurl yangberisi 5 file yaitu : curl.exe, crawler.bat, setting.php, crawler_idx.php, dan crawler_detail.php.
(jangan rubah nama folder dan nama filenya jika anda belum memahami code didalamnya) - buka file setting.php dengan notepad : rubah username, password dan alamat blog wordpress anda. jangan lupa disimpan.
$params = array('','','USERNAME','PASSWORD',$XML,1);
$request = xmlrpc_encode_request('blogger.newPost',$params);
$ch = curl_init();
curl_setopt($ch, CURLOPT_POSTFIELDS, $request);
curl_setopt($ch, CURLOPT_URL, 'http://localhost/wordpress/xmlrpc.php'); - Double click crawler.bat. Jika semua setting telah benar, semua posting dari web target akan masuk sebagai posting di blog anda.
Pada proses ini, Akan terbentuk folder crawler yang berisi file2 hasil download, dan folder log yang berisi log url yang telah didowload (telah dincode ke md5), log ini berfungsi sebagai pengecek agar link yang telah diambil tidak diambil ulang.
Berikut ini cara kerja script diatas :
- Crawler.bat terlebih dahulu memanggil file crawler_idx.php
- crawler_idx.php mengunjungi halaman http://topnew-gadget.blogspot.com dan mengambil semua url yang berisi judul posting di halaman blog tersebut, lalu menyimpannya dalam file url.txt
- crawler.bat mendownload semua url yang ada di url.txt dan menyimpannya di server lokal
- crawler.bat memanggil file crawler_detail.php dan memproses halaman hasil proses no.3 dan mempostingnya ke bolg yang sudah anda tentukan. crawler_detail.php juga memebentuk folder log yang berisi log md5 url yang telah didownload.
Jika ingin bereksperimen lebih lanjut dengan target lain, anda harus menyesuaikan kode-kode didalamnya terutama regular expressionnya….. semoga bermanfaat.