跳转到内容

维基百科:机器人建立条目小组

维基百科,自由的百科全书
(重定向自Wikipedia:CAB
机器人建立条目小组
成立時間2012年3月29日
類型使用机器人建立条目的维基百科组织
服务地区中文维基百科
官方語言
汉语

机器人建立条目小组(暂定名称)是一个致力于使用机器人大量建立条目,以丰富维基百科内容的组织。

数据库收录标准

[编辑]
  1. 100条以上
  2. 内容(除名称)多于50字

工具

[编辑]

数据库及完成进度

[编辑]

行政区划

[编辑]
完成进度 内容及数据库链接 数据库容量 进度时间 参与完成用户 备注
处理中…… 法国:342个(已完成300余个)
:4,032个(仅完成极少量,尚有4000多个)
市镇:36,781个(正在进行,尚有1万未完成)
40000 2012年 User:Tianyamm2
User:Stevenliuyi
User:Yhz1221
奥地利::84个(已经完成);市镇 2357个 2012年 User:Tianyamm2
User:Stevenliuyi
User:Yhz1221
瑞士:市镇 2,551个
波兰:379个市镇 2,479个
捷克:市、镇、村 5000个左右
斯洛伐克:市、镇、村 3000个左右
葡萄牙:市镇、堂区 308个4259个
罗马尼亚镇基本完成);乡: 2861个
保加利亚 市镇;264个\村5000个左右
克罗地亚 市镇429个
斯洛文尼亚 市镇:211个
塞尔维亚 市镇:150个;村:4000个左右
波黑 市镇142个
阿尔巴尼亚 市镇:351个
希腊 市镇:325个
乌克兰 区:490个
摩尔多瓦 乡镇村:917乡,699个无建制村庄
芬兰 市镇:336个
爱沙尼亚 市镇:226个;村:4000个左右
立陶宛 市、镇、村22000个左右
亚美尼亚 市镇915个
巴西 市镇5564个
哥伦比亚市镇 1119个
委内瑞拉 市镇335个
智利:市镇 346个
厄瓜多尔:县 226个
巴拉圭:县 129个
玻利维亚:市镇 337个
土耳其:县 957个
哈萨克斯坦 170 个
越南: 县+乡镇556个+11,112个
处理中…… 美国:进行中,完成部分州 请参见user: yhz1221/美国条目计划,尚有数千城市未建;
韩国 邑、面1357个
摩洛哥 统计表PDF N/A

自然物体

[编辑]
完成进度 内容及数据库链接 数据库容量 进度时间 参与完成用户 备注
机场,[1][2] 不明数量

植物

[编辑]
完成进度 内容及数据库链接 数据库容量 进度时间 参与完成用户 备注
处理中…… 饲用植物数据库,[3] 940 2013年 User:Makecat 内容表格化。描述较长,可能有版权问题。基本信息可能可用

人物

[编辑]
完成进度 内容及数据库链接 数据库容量 进度时间 参与完成用户 备注
未完成 中国工程院院士 约700 2013年 User:Gilgalad User:MtBell/E

医学

[编辑]
完成进度 内容及数据库链接 数据库容量 进度时间 参与完成用户 备注
未完成 罕見遺傳疾病一點通[4] 200左右 建議只建立與英文維基百科有連結的項目。
未完成 有关医学条目,A+医学百科 160000 因为存在版权问题被暂停

天文

[编辑]
完成进度 内容及数据库链接 数据库容量 进度时间 参与完成用户 备注
处理中…… Wikipedia:机器人建立条目小组/恒星条目 N/A N/A 目前正在移动相关条目至中文名
未完成 JPL小行星数据库[5] 100000

未开始

[编辑]
  1. 世界物种年度名录,1,323,005,[6],数量最大的資料庫,需要将拉丁学名翻译为中文。
  2. 美国国家地理空间情报局地名数据库,百万以上,英文版讨论,需要翻译地名。
  3. 中国经济真菌多媒体数据库,约1300条,[7],部分项目不能照抄(有版权问题)
  4. 台灣魚類資料庫,3098条,[8]
  5. 新浪娛樂互動資料庫,30000以上,[9]
  6. 中国鐵路車站,格式不規整、缺少可靠來源、部分錯誤\過時,由User:Liangent整理
  7. 日本铁路车站,ja:Category:日本の鉄道駅 (五十音別),约12,000
  8. 中国河流基本特征数据库,350,格式化数据:河流名称、河流长度、流域面积、年均流量、自然落差、水能理论蕴藏量、所属水系。使用{{Geobox/river}}。中国河流基本特征数据库User:MtBell/F
  9. 世界鱼类数据库[10],CC-BY-NC3.0,只能提取数据(不可照抄),约32400
  10. 雅典奧運会运动员,[11],约1000余
  11. 北京奧運会运动员,[12],约数百(不含重复)
  12. 伦敦奥运会运动员,[13],约数百(不含重复)
  13. 药用植物数据库,[14],11,987,不能照抄(有版权问题)
  14. 化石植物名录和文献,[15],1093,不能照抄(有版权问题)
  15. 中国科学院——科学数据库:中国植物主题数据库,[16],155,290
  16. 植物通--植物数据库,[17],不明数量
  17. 福建植物数据库,[18],不明数量
  18. 中国高等植物数据库全库,[19],35,364
  19. 非粮柴油能源植物数据库,[20],不明数量
  20. 中国蜜蜂数据库,[21],1000余,不能照抄(有版权问题)
  21. 中国动物图谱数据库,[22],不能照抄(有版权问题)
  22. 动物研究专家数据库,[23],约1500
  23. 中国濒危和保护动物数据库,[24],约600
  24. 中国药用动物数据库,[25],约300
  25. 中国动物物种编目数据库,[26],35,274
  26. 中国植物物种信息数据库,[27],约31,000
  27. 珍稀动物数据库,[28],不明数量
  28. 西藏大型经济真菌数据库,[29],不明数量
  29. 真菌物种数据库,[30],6910
  30. 野生大型真菌数据库,[31],1911
  31. 中国外来入侵物种数据库,[32],不明数量
  32. 古生物物种数据库,[33],不明数量
  33. 家禽疾病防治数据库,[34],273
  34. 水产疾病防治数据库,[35],457
  35. 检疫性动物疾病防治数据库,[36],97
  36. 美国行政区划,[37][38],需要翻译地名,数量较大
  37. 联合国安理会决议,[39]en:Category:United Nations Security Council resolutions by year,两千多
  38. 《中国鸟类野外手册》(12),1000多,不能照抄(有版权问题)
  39. Chemicalbook,http://www.chemicalbook.com/IndexCN.aspx,这是一个化学数据库,里面收录了五百多万种化学物质,其中大约五分之一有中文名。那些没有中文名的化学物质也可以很容易翻译成中文名,因为化学物质的名称一般就是由那么几百个词根组成的,每一个词根都有一个固定的翻译,比如nitro-翻译为硝基、cis-翻译为顺、trans-翻译为反等等。这些化学物质当然不是全部都有足够关注度,可以收录在维基百科,但是,一般情况下,一个化学物质的数据(密度、熔点、沸点等)越多,关注度就越大,因为这表示化学家们对该物质有很多研究,才能得出这么多数据。此外,一个化学物质的名称越短,关注度通常也越大,因为一个化学物质的使用率越高,大家就越想给它起一个简短、容易记的名称。因此,如果创建化学条目的话,建议只创建数据库中长度少于20个字(数字和符号算半个汉字)、数据多于五项的化学物质,保证创建的都是关注度足够的条目。

已完成/结束的项目

[编辑]
完成进度 内容及数据库链接 数据库容量 进度时间 参与完成用户 备注
完成 中华人民共和国行政区划
中华人民共和国行政区划网[40]
40000 2012年2-10月 User:Liangent
User:Symplectopedia
User:Makecat
User:Hat600
User:乌拉跨氪
User:Alexchris
User:Dingar
User:Stevenliuyi
User:Tianyamm2
User:Yhz1221
User:Justincheng12345
User:Gilgalad
User:Snorri
User:Angnation
User:Walter Grassroot
{{PRC admin}}
/中华人民共和国行政区划
完成 中国大中型水库
中国大中型水库基本特征数据库[41]
< 1622 2012年 User:Stevenliuyi
完成 中国湖泊
中国湖泊基本情况数据库[42]
< 865 2012年 User:Makecat
世界瀑布数据库,[43] 不明数量 数据库关闭
完成 德国:市镇 12,013个 2012年 User:Tianyamm2
User:Stevenliuyi
User:Yhz1221
完成 匈牙利市、镇、村 2000多 2012年 User:Tianyamm2
User:Stevenliuyi
User:Yhz1221
完成 意大利:市镇 8100个 2012年 User:Tianyamm2
User:Stevenliuyi
User:Yhz1221
完成 西班牙:市镇 8112个 2012年 User:Tianyamm2
User:Stevenliuyi
User:Yhz1221
完成 挪威 市镇:430个 2012年 User:Choihei
完成 中國科學院院士 约600 2012年 User:Gilgalad
完成 全国政协委员(第十届) 约1800 2013年4月 User:Walter Grassroot
完成 全国人大代表(第十二届) 约2200 2013年4月 User:Walter Grassroot
未完成 广州亚运会运动员 7000多 官方数据库 数据库已经关闭

子页面

[编辑]
全部

成员

[编辑]
在下方加入#~~~~即可加入本小组。
  1. MakecatTalk 2012年3月29日 (四) 07:11 (UTC)[回复]
  2. Tianyamm2留言2012年9月23日 (日) 11:55 (UTC)[回复]
  3. --♥VC XC 2012年11月6日 (二) 02:09 (UTC)[回复]
  4. Agp08090401留言2014年3月12日 (三) 11:55 (UTC)[回复]