UbuntuにBeautifulSoupをインストールした

Ubuntu 16.04にBeautifulSoupというライブラリをインストールした。

何ができるのかはわからないが、素晴らしいものらしい。

どっちをインストールしたらいいのかな?

参考文献(PythonによるWebスクレイピング)によると、Linux(Ubuntu)では

$ sudo apt-get -y install python-bs4

でインストールできるそうだ。

ところが、Python仮想環境を用意すれば、

$ pip install beautifulsoup4

でもいいらしい。

ふむ・・
困りましたな、助さん。

仮想環境へBeautifulSoupをインストール

仮想環境へのインストールはOS全体への影響がないので、まずは、仮想環境へインストールしてみた。

$ pyvenv kasopy ※仮想環境を作る。
$ source kasopy/bin/activate
(kasopy) $ ※コマンドプロンプトが変わる。
(kasopy) $ pip install beautifulsoup4

ちゃんとインストールされたか確認する。

$ python3 ※対話モードでPythonを起動する。
>>> import bs4 # BeautifulSoupをインストールする。
>>>

成功。

Ubuntuに直接インストール・・・

しようと思ったが、MacやWindowsではpipコマンドでインストールする方法しかないらしい。
ということは、Ubuntuでもpipコマンドでインストールできれば十分で、apt-getコマンドを使う必要性はないように思う。

ただ、このまま何もしないのも気持ちが悪いので、VirtualBoxでUbuntu 16.04の仮想マシンを構築し、そこでapt-getコマンドを打ち込んでみるとしよう。

〜 仮想マシン構築中 〜

apt-getコマンドを入力する前に、BeautifulSoupがインストールされていないことを確認する。

$ python3
>>> import bs4
>>>

あらら、すでにBeautifulSoupがインストールされている模様。
いったい、どうなってるんだ??

ちなみに、Python2でやってみると、

$ python
>>>  import bs4
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
ImportError: No module named bs4

なにやら釈然としないものを胸の奥に感じながら、私はexitコマンドを打ち込み、Python対話モードを後にした。
そしてシェルに戻ると、意を決してapt-getコマンドを入力した。

$ sudo apt-get -y install python-bs4

再度、Python2の対話モードへ突入し、BeautifulSoupをインポートしてみると、

$ python
>>> import bs4
>>>

おおっ、今度はエラーが出ない。
どうやら、こういうことだったようだ。

結論

ひとつ、PythonはPython 3.xを使う。
ひとつ、Pythonプログラムの開発には仮想環境を使う。
ひとつ、BeautifulSoupのインストールは「pip install beautifulsoup4」を入力する。

参考文献

PythonによるWebスクレイピング

Pythonプログラミング物語 © 2016 Frontier Theme