読者です 読者をやめる 読者になる 読者になる

Shut the fuck up and write some code

グダグダ言わずにコードを書きたいブログ

Node.js+phantomJSで使うモジュール

webエンジニアになりたい衝動のせいでNode.jsを使い始めた。少し前からHeroku+Node.jsで3ページ程度の超簡単なサイトを勉強がてら作ってはいたけども、本格的な処理は書いてないので、これからDB周りやら勉強兼ねて掘り下げて行こうと思ってます。

やりたいことの一つにページのスクレイピングがあって、NodeだとphantomJSで連携すると良いらしいぞ、と言うことで環境を構築してみた。


Node.js × PhantomJS で何でもサクサクスクレイピングするよ!

まずは上記を参考にphantomjs-nodeというモジュールを入れてみましたが

npm install phantom

エラーが出てインストール出来てない。

npm ERR! git clone git://github.com/substack/sockjs-node.git Cloning into bare repository '/Users/username/.npm/_git-remotes/git-github-com-substack-sockjs-node-git-728fed91'...
npm ERR! git clone git://github.com/substack/sockjs-node.git
npm ERR! git clone git://github.com/substack/sockjs-node.git fatal: unable to connect to github.com:


どうもsockjs-nodeというモジュールをインストールをgithubからgit cloneに失敗している模様。何じゃそれ・・・手動でやってみようとするもこのモジュール自体他のライブラリを使っていて、量も多く、依存関係がハンパないので挫折。自分には無理ポ。


代わりに

node.jsからPhantomJSを使ってPDFを生成する
Node.js + PhantomJS でウェブサイトのスクリーンショットを作成

上記を参考にnode-phantomというモジュールを入れてみたところ

npm install node-phantom

あっさりインストール完了。サンプルもコピペで動作出来ました。

とりあえず動いたし、こっちを使ってみようかなと思います。モジュールは色々あるようで定番と思われるものはそれほど無いようなので、トライ&エラーで試すしかないのかー。


サーバサイドJavaScript Node.js入門
清水俊博 大津繁樹 Jxck 小林秀和 佐々木庸平 篠崎祐輔 高木敦也 西山雄也
アスキー・メディアワークス
売り上げランキング: 287,319