在Ubuntu上
1)安装所有必需的软件包。
sudo apt-get install -y gcc python python-dev libssl-dev libxml2-dev libxslt1-dev zlib1g-dev python-setuptools python-pip
easy_install -U SQLObject
pip install MySQL-python
2)安装IMDBPY。
cd [IMDBPY_parent_directory]
wget http://prdownloads.sourceforge.net/imdbpy/IMDbPY-5.1.tar.gz
tar -xzf IMDbPY-5.1.tar.gz
cd IMDbPY-5.1
python setup.py install
3)在MySQL中,创建一个数据库 “IMDB”,并授予所有的权限为 “用户”,密码为 “密码”。
CREATE DATABASE imdb;
GRANT ALL PRIVILEGES ON imdb.* TO 'user'@'localhost' IDENTIFIED BY 'password';
FLUSH PRIVILEGES;
4)下载所有IMDB数据。
mkdir [imdb_data_directory]
cd [imdb_data_directory]
wget -r --accept="*.gz" --no-directories --no-host-directories --level 1 ftp://ftp.fu-berlin.de/pub/misc/movies/database/
5)将IMDB数据加载到mysql(使用myisam作为存储引擎)。
cd [IMDBPY_parent_directory]/IMDbPY-5.1/bin
python imdbpy2sql.py -d [imdb_data_directory] -u
'mysql://user:[email protected]/imdb' --mysql-force-myisam
从 “Import IMDb Data Set from Plain Text Files To MySQL Database” 借用一些小的修正。
谢谢一堆。那正是我想要的。花了大约4个小时,但现在我用IMDB获得了一个不错的3GB数据库:-) – Mestika