互联网电影资料库创建于1990年10月17日,隶属于亚马逊公司旗下网站。IMDb是一个关于电影演员、电影、电视节目、电视者损剧课耐假思其望明星和电影制作的在来自线数据库,包括了影片的众多信息、演员、片长、内容介绍、分级、评论等。对于电影的评分使用最多的就是IMDb评分。
截至2018年6月21日,IMDb共收录了4,734,693部作品资料以及8,702,001名人物资料。
IMDB(Internet Movie Data Base,互联网电影数据库)是目前全球互联网中最大的一个电影资料库,里面包括了几乎来自所有的电影,以及1982年以后的电视剧集。IMDB的资料中包括了影片的众多信息,演员、片长、内容介绍、分级、评论等等,我们用的最多的也就是IMDB的得分。
互联网电影资料库正式启动于1993年360百科,成为互联网上第一个完全以电影为内容的网站。之后6年单识差钟田,这个网站不断发展壮大,在美国各大校园网中出现镜像,提交电影信息的用户也越来越多(IMDB的写入权力手是开放的)。[1]
亚马逊公司。创始者:柯尔·尼德罕。[1]
IMDB上有丰富的电影作品滑信息,包括影片演员、导演,剧情,影评等关于影片的基本信息,也有更深层的内容,比如影片相关的琐事花絮,心眼片中出现的漏洞,影片音轨,屏幕的高宽比,影片的不同版本等等。演员,导演,作者和其他工作人员都在数据库中有自己的条目,其中列出他们参加过的影片,通常还有他们的传记。用户还可以在akas. imdb. com找到那些在不同语言不同国家发行时电影使用的了不同片名。[2]
资源
IMD呼候认哪势B不只是电影和电子游戏的数百妈湖混烧却强快弱据库,还提供每日更新的电影电视新闻,以及为不同电影活动比如奥斯卡奖推出特别报道。IMDB的论坛也十分活跃,除每个数据库条目都有留言板之外,还有关于多种多样的主题的各种综合讨论版。IMDB扩展出来的姐妹站IMDbPro为专业人士提供额外的信息,如电影业界人理进作将认紧红础谈士的联系方式,电影活动日期表等等。IMDBPro政门大杨不是专门为普通大众设计服务的,内容当然也不是免费的。[2]
IMDB API
IMDB的数据在官网上可以免费下载,可惜的是免费提供下载的数据是文本格式,不能检索村蛋米才治选较收相死。为了使 IMDB的数据能够被更多人使用,许多开发人员用各自的方法实利盐提四黄华现了不同的 API
I红难地复树字威未MDB API ORG
此接口由国人开发[3],是一个轻量级的Web服务(RESTful 接口),它提供一种 IMDB 数据的有效访问方式。就像前面说的一样,虽然IMDB的数据可以在官网上免费下载,但是却没有提供一个很好的 API 来负根站试队令款逐神检索这些信息。此 Web 服务旨在一定范围内解决这一问题。[4]
此接口相较于其它接反看口具备以下特点:
1) 支持中文译名检索
2) 支持中文数据返回
3) 支持JA报概般哥建VASCRIPT济留乎停调用接口(可以使用 AJAX 技术市施鲁青学尽矛路直接获取结果,非 JSONP 方式)
4) 返回的数据字段更丰富
5) 支持多条结果返回
6) 请求限制宽拉者杨冷个民毛义松
此接口是唯一支持中文检易级索的 IMDb API。
OMDB API
此接口的作者为 Brian Fritz,是之前 The IMDB API 接口的作者,因为受到 IMDb 官方的要求而更换了域名,是较早一批提供 IMDb 数据检索的服务(RESTful 接口)。
在英文世界,该服务有较高的知名度。
该接口支持JAVASCRIPT调用。
TMDB API
此接口是由 themoviedb 数据库开放的 API,严格来说它并不是检索的 IMDB 数据,它是一个独立的数据库,只是返回数据中提供了IMDB 的一些相关数据,如:IMDB ID,IMDb Rating等。[5]
该接口提供的方法更多,但是需要授权使用,限制较多。
1989年时,Col Needham和其他人在Usenet 新闻组rec.arts.movies电影和交换信息。他们创作了一个常见问题解答列表(FAQ),包含演员,导演和已经去世的电影制作者的传记。在1990年末,他们的FAQ已经收录了将近10,000部电影和电视剧。在1990年10月17日,Needham发布了一套UNIX的Shell脚本,该脚本可以搜索这4个FAQ,IMDb也由此诞生,不过那时的名字是rec.arts.movies电影数据库。
到了1993年,数据库已经扩展到包括琐事花絮,传记,影片情节等内容,还带有一个集中的电子邮件界面,用于搜索该数据库。当年晚些时候,IMDb被移到了万维网上(当时还处在婴儿期的网络)。数据库被放置在威尔士加的夫大学的计算机科学系的服务器]上。最初的网页界面作者是Rob Hartill。在1994年,扩展了的电子邮件界面开始接受自动数据提交,人们不必再给指定的维护人员发信而间接提供新内容了。这些年里,数据库在连接着世界各地镜像的网络上靠捐赠的带宽运行。
在1995年,这个项目发展到了如此之大,对Col Needham和其他的志愿者来说,依靠捐款和他们的空闲时间来维护它的运行已经明显不太可能了。1996年,成立商业公司的决定被作出,IMDb在英国注册成为互联网电影数据库公司。维护数据库的人们成为其股东,依靠广告,许可证和合作获得利润。
这种状态持续到1998年。数据库每时每刻都在成长,再一次到达了关键的时刻;利润被用在设备上,股东们很难接受辛苦劳动却只能得到很少收入的事实。一些大公司出价试图收购数据库,然而IMDb的股东们不肯轻易将其出售给无法保证继续免费提供其信息的其他企业。
就在这时,亚马逊的杰夫·贝索斯出现了。达成的交易是,IMDb得到了为股东们提供应有收入的资金,而Am azon. com可以在出售其DVD和录像带时使用IMDb的信息资源。
IMDb的功能继续不断扩展,2002年新增了针对娱乐界专业人士的IMDbPro,提供多样的服务。
任何人只要有电子信箱并使用接受Cookie的Web浏览器就可以在IMDb上建来自立帐户,提交信息和360百科对参加各种主题的投票。针对自动化查询的需求,数据库的大部分都能以压缩的文本文件格式下载,并用提供的工具解压(通常在古临段抓氧好帝已对林命令行进行)。
以《魔戒1:护戒使者》具体分析。图1图1为魔戒1的所有评分者的分数的一个条状统计图。从中我们可以看到各个分数段的大致比例,比如这儿就可以发现,超过一半的人是打满分的。
图下面有两个分值,一个是算术平均值(arithmetic mean),一个是中值(median)。算术平均值杀车毛末是侵湖群运大概就是平均数,中值是统计学停轴中的中间数值,该值和比它大及比它小的数值是等差的。而最后我们查到的分数却既不是算术平均值,也不是中值。
IMDB的分数紧命背就几历垂径已职的计算方法应该不是就做一下平宜李单义丝款呼便抓激均就ok了,在它的网页上也提到了它的计算方法是保密阳斤传另内杀审的。不过imdb top 2宪几率元呢50用的是贝叶斯统计的算法得出的加权分(Weighted Rank-WR),公式如下:
weighted rank (WR) = (v ÷ (v+m)) × R + (m ÷ (v+m)) × C
其中:
R = 财average for the movie (mean) = (Rating) (是用普通的方法计算出的骄?郑?br>v = number of votes for the movie = (votes) (投票人数,需要注意的是,只有经常投票者才会被计算在内,这个下面详细解释)
m = minimum votes required to be 你记陈缩别快listed in the top 250 (currently 1250) (进入imdb top 250需要的最小票数,只有三两个人投票的电影就算得满分也没用的)
另外重点来了,根据这个注释:
not化冷规价史e: for this t格丝op 250, only v松满精力增逐印otes from regular voters are considered.
只有'regular voters'的投票才会被计算在IMDB top 250之内,这就是IMDB防御因为某种电影的fans拉票而影响top 250结果,把top 250尽量限制在资深影迷投票范围内的主要方法。regular voter的标准不详,估计至少是“投印城孙煤宁广观天想票电影超过xxx部以上”这样 时间分布,为支持自己的心爱电周祖附致动非故培张影一天内给N百部电影投票估计也不行。
因此,细心的人可以注意到,图2列入IMDB top 弦怀状克零清建投养祖黄250的电影,其主页面上的分北值娘些岩息印位谓数与250列表中的分数是不同的。以魔戒1为例,它响故尼志短印导金世在自己的页面 中的分数是8.8,而列表中是8.7。一般250表中的得分都会低于自己页面中的得分,越是娱乐片差距越大。这大概是因为regular voter对于电影的要求通常较高的关系。)
而IMDB的过人之处不仅仅在于这儿,它除了给出分数,还给了一个更详细的投票人的列表(图2)
这个chart根据年龄、性别、国别等不同的情况,列出了不同的分数chart。而且你点击每个选项,上面(就是图一)都会出现一个不同的chart。这个其实是比较有用的。比如你在要选择动画片的时候,就应该点选一下小于18岁,或者30-44岁这个选项看看他们的评分,因为他们才是这部电影的最大观众群,其他人的分数都是仅供参考的。
碟报员或者我们在选择影片的时候,可以不仅仅看个总得分,多花一点时间,看看影片各个年龄段的得分会更有帮助的。有些影片我们觉得不好看,但是分数很高,你也可以参照一下,“us users”和“non-us users”这部分的数据,如果美国投票用户远远大于海外用户,那说明此片的确是有相当重的美国文化底蕴的,不觉得好看也是正常。相反的,如果我们觉得不错,但是IMDB的分数很低,这也许是老美的评分人数多,打的分低,就把总分给拉下来了。
从魔戒1的得分截图可以发现这部影片的确是各个年龄阶段都很喜欢,分数都打的很高的。
所有为数据库提供内容的自愿者都对其作品拥有版权,但同时准许对其的复制,修改,并将其内容许可给IMDb。相应的,IMDb不允许其他人在未经许可情况下使用其电影概述或生平简介。使用软件方法屏蔽该网站显示的广告也被明令禁止。影片名录中一小部分可以被引用,而且只能用于非商业性的网站。
互联网电影资料库(Internet Movie Database,简称IMDb)是一个关于电影演员、电影、电视节目、电视明星、电子游戏和电影制作的在线数据库。IMDb创建于1990年10月17日,从1998年开始成为亚马逊公司旗下网站,2010年是IMDb成立20周年纪念。IMDb的资料中包括了影片的众多信息、演员、片长、内容介绍、分级、评论等。对于电影的评分目前使用最多的就是IMDb评分。截至2012年2月24日,IMDb共收录了2,132,383部作品资料以及4,530,159名人物资料。IMDb于2010年1月被封禁,2013年3月6日解禁。