如何将 IMDB 的文本数据导入到 MySQL数据库

1. 到 IMDB 官方的 ftp镜像下载 IMDB 数据
下载地址可以在一下也网页中找到:http://www.imdb.com/interfaces
然后选择相应的 ftp站点进行下载,ftp 中的都是文本数据的 gz压缩包,可以使用 lftp 工具下载。

lftp ftp://ftp.fu-berlin.de/pub/misc/movies/database/
lftp ftp.fu-berlin.de:/pub/misc/movies/database> lcd /path/to/imdb/
lftp ftp.fu-berlin.de:/pub/misc/movies/database> mirror
一般 diff目下的文件我们都不需要,可以之下载常用的数据
lftp ftp.fu-berlin.de:/pub/misc/movies/database> mget *

2. 安装 python-imdb
yum install -y python-imdb

3. 导入 imdb 数据到 MySQL数据库中
/usr/share/doc/python-imdbpy/examples/imdbpy2sql.py -d /path/to/imdb/ -u user:pass@localhost/imdb

历史搜索记录:

One Comment

  1. 杨立涛
    Posted 2015 年 6 月 12 日 at 下午 1:31 | Permalink

    您好!

    我想对IMDb里的数据作一些研究,已经基本搞定后面两步。
    第一步不知道怎么下,我想问一下怎么下载IMDb数据?
    我下载了几个工具,都连接不上ftp站点。

    期待您的回复!

Post a Comment

Your email is never shared. Required fields are marked *

*
*