維基百科討論:翻譯指引/存檔2
本頁是以往討論的存檔。請勿編輯本頁。若您想發起新討論或重啟現有討論,請在當前討論頁進行。 |
內容翻譯將不會再持續觸發大量建立條目過濾器導致無法發佈
過濾器本地修了。如題,僅於此公告。--Xiplus#Talk 2021年5月10日 (一) 15:29 (UTC)
- 本人曾製作繞過腳本TranslationHelper.js用以繞過過濾器發佈到自己用戶頁,但願今後不需要了,笑。--E.A.Crowley666✍️ 2021年5月12日 (三) 15:35 (UTC)
DeepL
今日留意到有用戶因為在中文維基百科增添以DeepL機器翻譯([1])的文字而遭到封禁。讓我有點震驚的是,經過比對某英文維基百科條目原文和機器翻譯產生的中文文句,在某些段落上我發覺自己的翻譯水平比DeepL好不了多少。--Mewaqua(留言) 2021年6月23日 (三) 01:29 (UTC)
- Wikipedia:翻譯指引#翻譯注意事項。--寒吉 2021年6月23日 (三) 08:57 (UTC)
- 13年前「通過各種翻譯軟件或者在線翻譯網站進行機器翻譯的條目,由於機器翻譯的質量很差,很容易讓人難以理解內容。」(「Wikipedia:翻譯指引」2007年8月20日版本)這段話也許在當時大致正確,但是我覺得今時今日DeepL英譯中的文句不至於「品質通常都會差到讓人難以理解」,雖然也不是絕無錯誤。--Mewaqua(留言) 2021年6月23日 (三) 10:53 (UTC)
- 「桶川跟蹤狂殺人事件」→
- 日語條目為「桶川ストーカー殺人事件(おけがわストーカーさつじんじけん)とは、女子大學生が元交際相手の男を中心とする犯人グループから嫌がらせ行為を受け続けた末、1999年(平成11年)10月26日に埼玉県桶川市のJR東日本高崎線桶川駅前で殺害された事件。警察捜査上の名稱はJR桶川駅西口女子大生路上殺人事件。桶川事件とも呼ばれる。本件の発生が契機となり、2000年に「ストーカー規製法」が制定された。」
- 陳寅恪使用DeepL翻譯成中文為「大溪川跟蹤者謀殺案是指1999年10月26日,一名女大學生在埼玉縣大溪川市的JR東高崎線大溪川站前被謀殺,因為她受到了以前男友為首的一群犯罪分子的持續騷擾。 在警方的調查中,它被稱為JR沖繩站西口女大學生路邊殺人案。 它也被稱為大溪川事件。 這一事件導致2000年頒佈了《跟蹤者管理法》。」
- 實際應該翻譯成中文為「桶川跟蹤狂殺人案,是一名女大學生因生前不斷受到以過去約會對象為核心的犯罪集團跟蹤騷擾之後,1999年10月26日在日本埼玉縣桶川市的東日本旅客鐵道高崎線桶川站外遭到殺害的事件。日本警察[…]此事件促使《纏擾防治法》在2000年通過施行。」
- 陳寅恪只單純機器翻譯,根本沒在為該粗體的地方加上粗體,該加上內連的地方加上內連,該調整的格式都沒調整,很多專有名詞都如下方安亭所言都隨便機器翻譯亂譯,最過分的是參考資料也不附上。我們其他用戶不應該花時間幫這種用戶收拾爛攤子吧(Special:Diff/66075475/66080638)。--寒吉 2021年6月24日 (四) 10:03 (UTC)
- 「桶川跟蹤狂殺人事件」→
- 13年前「通過各種翻譯軟件或者在線翻譯網站進行機器翻譯的條目,由於機器翻譯的質量很差,很容易讓人難以理解內容。」(「Wikipedia:翻譯指引」2007年8月20日版本)這段話也許在當時大致正確,但是我覺得今時今日DeepL英譯中的文句不至於「品質通常都會差到讓人難以理解」,雖然也不是絕無錯誤。--Mewaqua(留言) 2021年6月23日 (三) 10:53 (UTC)
- 認真看條目了嗎?上面提到的編輯中:
- 「波士頓凱爾特人隊剛剛結束了1949-50賽季的NBA比賽,取得了22勝46負的糟糕戰績,並獲得了第一個選秀權」,first draft pick錯譯,應為「首輪選秀權」;
- 「然而,教練雷德-奧爾巴赫卻為了中鋒查理-享樂而放棄了他,他說 "我是要贏球,還是要取悅當地的鄉巴佬?" 」,1. snubbed him for center Charlie Share,意思是這個教練看中了中鋒Charlie Share,而放棄了他;2. 查理-享樂人名錯譯,應為查克·謝爾
- 「當地媒體強烈批評奧爾巴赫,但其他球探也對庫西持懷疑態度,認為他很張揚但沒有效果。」,flamboyant but ineffective,華而無實,不是什麼沒有效果;
- 「一位球探在他的報告中寫道。"他第一次在這個聯盟中嘗試那些花哨的丹的東西,他們就會把球塞進他的喉嚨。" 」,fancy Dan stuff,耍花招,不是什麼「丹的東西」;
- 「作為不得不放棄他的駕駛學校的補償,庫西要求黑鷹隊老闆本-克納給他10,000美元的薪水。」,「不得不」無需翻譯;
- 「庫西隨後被芝加哥雄鹿隊選中,但當他們倒閉時,聯盟專員莫里斯-波多洛夫宣佈有三名雄鹿隊球員可以參加散兵游勇:球隊得分王馬克斯-扎斯洛夫斯基、安迪-菲利普和庫西。」,1. 球隊「解散」不是「倒閉」;2. dispersal draft,解散選秀,不是什麼「散兵游勇」;
- 「他後來明確表示,他希望得到扎斯洛夫斯基,會容忍菲利普,而不想要庫西。」,希望選中扎斯洛夫斯基,能接受菲利普,但不接受庫西;
- 「當凱爾特人隊抽到庫西時,布朗坦言。"我本來可以倒在地上的"。」,"I could have fallen to the floor",我差點癱倒在地;
- 「庫西以平均每場15.6分、6.9個籃板和4.9次助攻的成績,獲得了他連續13次入選NBA全明星的第一次機會,並在1950-51賽季的NBA比賽中,帶領着擁有未來奈史密斯籃球名人堂成員埃德-澳門利和邦斯-麥金尼的凱爾特人隊取得了39-30的成績。」;
- 「在下個賽季,隨着未來名人堂後衛比爾-沙曼的加入,庫西平均每場比賽得到21.7分、6.4個籃板和6.7次助攻,並首次獲得全NBA第一隊的提名。」,All-NBA First Team是NBA最佳陣容,是那個人獲得了NBA最佳陣容的榮譽,不是那個隊入選了什麼「全NBA第一隊」;
- 「在接下來的賽季中,庫西取得了進一步的進步」;
- 「平均每場7.7次助攻,他贏得了連續八次助攻冠軍中的第一次。」;
- 「這些數字是在NBA還沒有引入投籃時間的情況下取得的,這使得比賽變得靜態,使多產的助攻者處於不利地位。」,「多產的助攻者」;
- 「儘管腿部受傷,但他在四節比賽後得到了25分,在第一個加時賽中得到了球隊9分中的6分,在最後幾秒鐘投中了一個關鍵的罰球,並在第二個加時賽中得到了波士頓的全部4分。」
- 「在第四個加時賽中,他得到了波士頓隊12分中的9分。」;
- 「在接下來的三年裏,庫西牢牢確立了自己作為聯盟最佳得分後衛之一的地位」,"point guard"明明是控球後衛不是得分後衛;
- 「在所有3個賽季中,庫西的助攻數都是聯盟第一,平均20分和7個籃板,多才多藝的庫西又為自己贏得了3次NBA第一隊和全明星的榮譽,同時也是1954年NBA全明星賽的最有價值球員。」;
- 「在打球風格方面,庫西引入了一系列視覺上有吸引力的街頭籃球動作,被NBA描述為混合了掌上壓、背後運球和 "無視傳球、背後傳球或半場快攻發射"。」,1. ambidextrous是雙手交替傳球,不是什麼掌上壓;2. launch是發起,不是發射;
- 「庫西的工作方式與NBA其他球隊形成鮮明對比,後者由肌肉發達的低位得分手和刻意設置的射手主導。」,這是籃球比賽還是射擊比賽?
- 「不久,他被稱為 "硬木的胡迪尼",取自魔術師哈里-胡迪尼。」,hardwood美國俚語裏是籃球場的意思,不是什麼「硬木」;
- 「庫西討人喜歡和有效的比賽吸引了波士頓花園的觀眾,也贏得了教練奧爾巴赫的青睞,他不再認為他是一個累贅,而是未來的一個重要基石。」,「波士頓花園」是個體育場;
- 「與凱爾特人隊的同事鮑勃-布蘭納姆一起,洛斯庫托夫也成為庫西的非正式保鏢,對試圖傷害他的對手球員進行報復。」,
- 比起不懂就輸出亂碼的軟件,這種乍一看很通順,但實則夾雜着各種大小錯誤(平均1.5句一個明顯錯誤),不懂裝懂的軟件,某種意義上危害性更大。如果讀者沒有查證(而這不是讀者的義務),他/她不會意識到原文想說的是「首輪選秀權」而不是那個隊第一次獲得選秀權;「 查理-享樂」其實不叫這個名字;球隊解散以後老球員是參加了一次「解散選秀」而不是加入了「散兵游勇」隊;那人自己選入了NBA最佳陣容,而不是帶領那個隊獲得了NBA第一隊的榮譽;在場上打的是控球後衛不是得分後衛;等等。--Antigng(留言) 2021年6月23日 (三) 14:43 (UTC)
- 我比對的是en:George Bellows的小部分文字,另外也用en:Tigray War的小部分文字去比對,不過Antigng在上面的分析很好。--Mewaqua(留言) 2021年6月23日 (三) 15:09 (UTC)
- 我也發現了,最近這兩年各大機器翻譯都偏愛那種文鄒鄒的調調,好的時候讀起來挺好的,糟糕的時候很糟糕,就跟抽瘋一樣--百無一用是書生 (☎) 2021年6月24日 (四) 02:46 (UTC)
- 我比對的是en:George Bellows的小部分文字,另外也用en:Tigray War的小部分文字去比對,不過Antigng在上面的分析很好。--Mewaqua(留言) 2021年6月23日 (三) 15:09 (UTC)
- 似是而非,不如不用。—— Eric Liu 創造は生命(留言.留名.學生會) 2021年6月25日 (五) 06:12 (UTC)
是否可以為他人翻譯的條目添加{{Translated page}}
Wikipedia:翻譯指引指出應該在翻譯條目的討論頁掛上{{Translated page}},這雖然只是一個指引,但未進行該步驟(或在編輯摘要聲明)的話就是違反了CC BY-SA 3.0協議署名的要求。現在發現一些明顯是翻譯的條目卻沒有恰當署名,這樣放着應該是不合規的。但他人為這些條目添加{{Translated page}}可能產生信息錯誤(如原始條目語種不明)及潛在的法律問題(演繹作品的著作權聲明義務應該屬於原始翻譯者)。不知道社區對這一點有沒有共識呢?--立日(留言) 2022年6月16日 (四) 09:27 (UTC)
- 如果能確認翻譯源是來自於其他語區維基百科的話,可以。如果能跟編輯者確認的話,最好是這樣。——Sakamotosan路過圍觀 | 避免做作,免敬 2022年6月16日 (四) 09:46 (UTC)
- 好像日區對於這樣情況會非常嚴格要求版本甚至正頁侵權刪除。而本語區基本上沒特定地針對這種情況,或者默許或不知道存在這種編輯狀況。——Sakamotosan路過圍觀 | 避免做作,免敬 2022年6月16日 (四) 09:48 (UTC)
- 簡單來講:
- 可以的
- 應該的
- 條目討論頁是公共空間,任何人可以進行編輯,沒有什麼需要迴避的問題;而遵守版權要求也是必須的,因此如果確實是翻譯來的,應當全部掛上。--MilkyDefer 2022年6月16日 (四) 11:54 (UTC)
- 同milky.--Temp3600(留言) 2022年6月16日 (四) 12:33 (UTC)
- 如果能確認,可以。建議通知譯者(如留言或{{ping}})並建議後續創建自行做出標註。更極端例子參考Template:Yeeyan。--YFdyh000(留言) 2022年6月16日 (四) 22:49 (UTC)
- 謝謝大家的意見,這樣以後發現這類條目可以放心加上了。--立日(留言) 2022年6月18日 (六) 10:03 (UTC)
- 翻譯的條目需要加上其它維基百科的來源,因此可以直接添加,不通知主編也行。--Leiem(留言·簽名·維基調查) 2022年6月18日 (六) 10:12 (UTC)
機器翻譯不應該一刀切
機器翻譯可以提高翻譯效率,它有好的方面也有不好的方面,但是不至於一刀切。當然人工修改是不可或缺的。如果規定看到疑似翻譯就可以草稿畫,提刪,不只造成模糊的裁量權,而且還容易矯枉過正。--Hzt0208042508415531 tw(留言) 2022年7月28日 (四) 18:40 (UTC)
我沒有看到其他語言禁止使用機器翻譯,包括粵語。所以這個規則是否應該修改呢? 英語維基百科推薦使用谷歌翻譯,當然它翻譯中文不理想,我們可以推薦更好的翻譯嗎? 這個是俄語中的有關部分
機器翻譯是一種幫助,但不能替代現場翻譯。在為 Wikipedia 翻譯文本時,您可以使用自動翻譯程序,例如Google Translate、Yandex.Translate或DeepL。現代技術允許您通過機器翻譯器運行外語文章,並立即獲得完成的俄語文章 - 但您不必屈服於立即將其發佈在俄語維基百科上的誘惑(您可以在個人草稿中)。最多將機器翻譯視為草稿,這是構建完整的俄語文章的基礎。包含原始機器翻譯的文章會在沒有討論的情況下迅速刪除 - 此C2有一個單獨的標準:文章不是俄語或機器翻譯。文章的主題、重要性和必要性無關緊要:如果讀者想通過機器翻譯閱讀原文,他可以自己通過機器翻譯來運行。機器翻譯通常會忽略腳註,非常重要的是,會忽略對權威來源的引用——它們必須手動放置。一篇根本沒有引用權威來源的文章也可以通過標準C5 快速刪除:沒有百科全書意義證據的文章——不管這些引用是否在原著中。
--Hzt0208042508415531 tw(留言) 2022年7月28日 (四) 18:44 (UTC)
- 日語版似乎禁止機器翻譯,我之前創建一篇條目就被以侵權為由刪除了。--Thyj (คุย) 2022年9月22日 (四) 05:42 (UTC)
- 從ja:Wikipedia:削除依頼/ハルダル・ナグ理由看,似乎是過度依賴機翻(修改不足)和內容源標註不規範。我不確定不規範具體指什麼,但大概是譯文太過機翻了。--YFdyh000(留言) 2022年9月22日 (四) 05:51 (UTC)
- 我第一次在那裏創建,所以還不知道。--Thyj (คุย) 2022年9月22日 (四) 06:18 (UTC)
- 從ja:Wikipedia:削除依頼/ハルダル・ナグ理由看,似乎是過度依賴機翻(修改不足)和內容源標註不規範。我不確定不規範具體指什麼,但大概是譯文太過機翻了。--YFdyh000(留言) 2022年9月22日 (四) 05:51 (UTC)
翻譯工具還有用嗎?
不能使用翻譯工具不說,我逐字翻譯後,最後「你的翻譯總共有1%未經修改的文字」而無法發佈,這1%估計是模板及外語標示,連放去自己的沙盒都不准。——白布飄揚(留言) 2022年12月31日 (六) 16:20 (UTC)
中維的翻譯指引中介紹了{{TransH}}與{{TransF}}的使用,造成了模板的濫用。英維的翻譯指引並未介紹模板使用,模板使用量也不大,已於14年提刪通過。
提議修訂WP:翻譯指引,移除對模板的介紹,並在清理使用的頁面後正式棄用{{TransH}}與{{TransF}}。
|
|
--PexEric 💬|📝 2023年1月21日 (六) 08:17 (UTC)
- 該模版於不少計劃頁面、模版介紹頁仍有作用,不應廢除。--Temp3600(留言) 2023年1月21日 (六) 13:13 (UTC)
- 非條目空間的由機械人轉成其他通用摺疊模板?感覺原文就原文,放那裏也沒影響,沒必要專門造個模板。看不下去也不想翻譯的,用
<!-- -->
藏掉就好了。--洛普利寧 2023年1月21日 (六) 13:25 (UTC) - 主要是停用,不是移除。修訂指引後在模板頁掛上{{Deprecated template}},不引導編者再使用了。至於使用的頁面可以慢慢清理,並不着急。--PexEric 💬|📝 2023年1月24日 (二) 06:26 (UTC)
- 在條目中的確不應再放未翻譯材料了。但在模版介紹頁這仍是常用做法(誰有空譯這些?),註釋掉也不便後人理解。暫時想不到可以替代它的模版。--Temp3600(留言) 2023年1月24日 (二) 16:41 (UTC)
- 非條目空間的由機械人轉成其他通用摺疊模板?感覺原文就原文,放那裏也沒影響,沒必要專門造個模板。看不下去也不想翻譯的,用
- (+)支持,transH模板本身不需要廢,但使用transH模板的一個很大的問題是,處於其中的其他模板,ref,分類都會在正文裏顯示出來,而通常這些都未譯,例,因此支持將指引中的內容移除。->>Vocal&Guitar->>留言 2023年1月23日 (一) 04:47 (UTC)
- 支持提案,具體意見同Ohtashinichiro。Sanmosa Συ γάρ μοι και μοίρα εί και τύχη 2023年1月23日 (一) 06:22 (UTC)
- (~)補充:Wikipedia:模板消息/清理#摺疊也需要同時修訂更改。——PexEric 💬|📝 2023年1月25日 (三) 13:12 (UTC)
公示7日,2023年2月6日 (一) 09:07 (UTC) 結束--PexEric 💬|📝 2023年1月30日 (一) 09:07 (UTC)
- 先(-)反對,未提出如何解決部分翻譯的問題。這個公示是不是有些過早?--Kethyga(留言) 2023年2月5日 (日) 11:20 (UTC)
- 基本上根據WP:翻譯指引,"當一個條目超過3個月內沒有進行翻譯,那麼將撤去翻譯模板,刪除非中文的內容"。我剛在約使用到這兩個折疊模板的四百多個一般空間條目中隨便點開幾個來看,基本上都可以使用"3個月未翻譯撤去模板"的規定進行模板撤除與非中文內容刪除。與其說被濫用,倒不如說該清理而未清理,與其屆時清理,不如直接開始清理吧。其次英語維基百科刪除的原因是未使用(Unused),而中文維基百科目前使用量(含模板、使用者空間等)約六百筆,看起來很WP:ENWPSAID。與其先改翻譯指引,不如先清理完四百多個一般空間條目,看看不適用"3個月未翻譯撤去模板"而剩下來的一般空間條目與約一百多筆的使用者頁面條目的情況,再行指引修改的討論,可能會比較適宜。--Anghualee(留言) 2023年2月8日 (三) 16:54 (UTC)
- 提議擱置
。——PexEric 💬|📝 2023年2月18日 (六) 11:09 (UTC)
提議限制在維基百科使用ChatGPT及類似工具
最近幾個月爆火的ChatGPT可以按照人類的提示生成文本,並且能根據人類的意見進行修改。但其生成的文本常常似是而非,看上去沒有問題而實際上卻含有事實錯誤,因此如果在條目中大量使用,可能會具有非常惡劣的影響。
StackOverflow已經禁止使用ChatGPT生成的內容,因此,中文維基百科社群是否應該跟進?
可行的方案:
- 完全禁止使用ChatGPT生成的內容編寫條目;
- ChatGPT生成的內容須經過人工審閱確認無問題之後才允許出現在條目中。
相關連結:
- Temporary policy: ChatGPT is banned - Meta Stack Overflow
- Should ChatGPT be used to write Wikipedia articles? - Slate
以上。--Diskdance 2023年1月28日 (六) 01:42 (UTC)
- 原則上支持,但不論是禁制還是審閱如何自動分辨為需要審核或禁止?人工難以審核每一個新頁面和版本差異確認沒有AI編寫內容。--路西法人 2023年1月28日 (六) 01:47 (UTC)
- 以Stack Overflow為例,他們唯一能實際做的是在有用戶被發現疑似使用ChatGPT的時候才予以禁制,無法杜絕有關內容的發佈。您的兩個建議方案都涉及審核所有ChatGPT寫的內容,除了一般的舉報外如何做到?還是只能跟現在的侵權提報一樣有人發現才報?--路西法人 2023年1月28日 (六) 01:50 (UTC)
- 不認為您的方案可行。ChatGPT等工具並不像Google Translate那樣輸入和輸出總是相同,很容易受到使用者的影響,不是能夠直接禁止的。社群似乎也不具備人工審核每一筆編輯的能力。若要求使用此類工具的用戶主動聲明倒是可以,但也定然不是所有用戶都會主動聲明。同時,用戶也可能是生成後自行潤色,將其質量提升到可接受的標準後再發佈。—— 月_櫻_雪 (留言) 2023年1月28日 (六) 01:54 (UTC)
- 1不實際可行,缺乏有效檢測手段。2在當前意義不大,條目本應被巡查,沒有必要「歧視」。如有濫建、批量建立發生,按尋常規則處理即可,判斷是否出自AI及質量如何沒有依據。對要求申報表示支持,參考機械人、有償編輯等方針,但落實存難度會變成君子協定。--YFdyh000(留言) 2023年1月28日 (六) 03:09 (UTC)
- 這是惡意推定,我不知道使用ChatGPT造成何種破壞或者違法哪一方面的規則。--Cat on the Mars 2023年1月28日 (六) 03:56 (UTC)
- 這個時候就得搬出User:0xDeadbeef在英維舉出的例子了。以下是使用ChatGPT生成的關於Rust for Linux的條目片段(方便不懂相關領域的編者,部分術語我自己添加了內鏈):
Rust for Linux是向Linux內核項目提交的一系列補丁的總稱,這一系列補丁讓Rust語言可以用於編寫內核組件。該項目始於2017年,由一群對將Rust用作系統底層開發感興趣的志願者發起。
Rust for Linux is a series of patches to the Linux kernel that adds the Rust programming language as a second language for writing kernel components. The project was started in 2017 by a group of volunteers who were interested in exploring the use of Rust for low-level systems programming.
早先的補丁是與Linux內核維護者以及開源群體一同合作開發而成的。這些補丁聚焦於將Rust的內存安全以及並行特性帶入內核當中,同時提供對已有的C語言代碼基礎的相容性。
The initial patches were developed in collaboration with the Linux kernel maintainers and other members of the open-source community. They focused on integrating Rust's memory safety and concurrent programming features into the kernel, and on providing compatibility with the existing C codebase.
在2018年,這些補丁被合併至Linux內核代碼庫當中,令Rust成為第一門除C語言之外,獲官方支持可以用作編寫內核組件的語言。對於Rust語言社群來說是里程碑式的成就,展示了Rust語言可以勝任內核級別編程的需求。
In 2018, the patches were merged into the mainline Linux kernel, making Rust the first programming language other than C to be officially supported for writing kernel components. This marked a significant milestone for the Rust community, as it demonstrated the language's ability to handle the demanding requirements of kernel-level programming.
自Rust語言加入至Linux內核之中起,Rust for Linux項目持續發展,當前聚焦於改善Rust在內核中運作的兼容性以及效率。該項目還吸引了其他作業系統開發者的注意力,令他們對將Rust語言用作內核級別編程所帶來的潛在優點感興趣。
Since its inclusion in the Linux kernel, the Rust for Linux project has continued to evolve, with ongoing work on improving the compatibility and performance of Rust in the kernel. It has also attracted the attention of other operating system developers, who are interested in exploring the potential benefits of using Rust for kernel-level programming.
- 我就問一句,這麼有模有樣的段落你能發現這裏面捏造了好幾個關鍵事實嗎?你們還覺得這不會造成破壞嗎? --MilkyDefer 2023年1月28日 (六) 09:12 (UTC)
- 註:我自己能注意到的捏造事實如下
- Rust for Linux項目起始於2020年,不是片段中宣稱的2017年;
- Rust for Linux項目代碼合併至Linux內核是在2022年,不是片段中宣稱的2018年;
- 當前Rust for Linux還沒有達到有閒心改善兼容性和效率的地步,當前只有最基礎能讓編譯順利通過的部分。
- 有這麼方便的工具那些喜歡搞鬼祟破壞的LTA們簡直笑開花了啊。 --MilkyDefer 2023年1月28日 (六) 09:16 (UTC)
- 另外不要忘記維基百科是自然語言處理領域重要的數據集來源,我們有義務不要搞出垃圾進入維基百科又被提取成訓練垃圾生成器的原材料的事情。--MilkyDefer 2023年1月28日 (六) 09:21 (UTC)
- 我認為鑑於ChatGPT的現狀,應該將它按對待人類新手的方式處理,事實上就內容而言我們也無法區分新手和機械人之間的區別,何況你站已經封禁了絕大多數代理網段,僅僅憑藉實驗內容無法證實其破壞性或者真的有人會用來破壞,加上理論上ChatGPT還在使用舊的數據集,分辨拙劣過時內容遠遠比分辨是否是高級AI作品更加具備可行性也更加重要,暫時沒有必要就這件事因「人」立法,如果需要修改方針必須證明現有方針在哪一方面無法滿足你的需求(包括劣質訓練集,還不如去改進你站存廢積壓)。--Cat on the Mars 2023年1月28日 (六) 09:38 (UTC)
- 再新手也不會寫出金玉其外敗絮其中的內容,真正的新手是寫出來讀出來就像是新手。你說的這不是新手,是破壞者。--MilkyDefer 2023年1月28日 (六) 09:44 (UTC)
- 你維的毛某人浪跡天涯多少年了,這種抓不出來其他更是抓不到,你維有長過記性了嗎,我說過不要因人立法,不是因為一會兒折毛,一會兒ChatGPT,封個把人就能解決的事情,ChatGPT就我的實際體驗還不具備單獨作案的能力,我剛剛想要讓他搞點引用都得費神很久,像這麼一大段無來源內容理所應當就是劣質內容,巡查員應該有自己的判斷。----Cat on the Mars 2023年1月28日 (六) 10:01 (UTC)
- 本人基本同意CatOnMars的觀點。--0xDeadbeef(留言) 2023年1月28日 (六) 10:17 (UTC)
- 至少舉例中如果缺少來源(或者來源能通過編輯者審閱並確認過的話),還是能區分出行文問題。需要注意但不至於需要規例。——Sakamotosan路過圍觀 | 避免做作,免敬 2023年1月29日 (日) 00:41 (UTC)
- 你維的毛某人浪跡天涯多少年了,這種抓不出來其他更是抓不到,你維有長過記性了嗎,我說過不要因人立法,不是因為一會兒折毛,一會兒ChatGPT,封個把人就能解決的事情,ChatGPT就我的實際體驗還不具備單獨作案的能力,我剛剛想要讓他搞點引用都得費神很久,像這麼一大段無來源內容理所應當就是劣質內容,巡查員應該有自己的判斷。----Cat on the Mars 2023年1月28日 (六) 10:01 (UTC)
- 再新手也不會寫出金玉其外敗絮其中的內容,真正的新手是寫出來讀出來就像是新手。你說的這不是新手,是破壞者。--MilkyDefer 2023年1月28日 (六) 09:44 (UTC)
- (!)意見 我認為把可供查證做好就能避免大部分問題。--Taeas(留言) 2023年1月28日 (六) 12:10 (UTC)
- (+)支持。我當然知道實際上禁之不絕,但態度還是要擺出來。--Temp3600(留言) 2023年1月28日 (六) 19:56 (UTC)
- 我認為標題中說的「限制」就可以了,不必要禁止也難以禁止(如何分辨,難道搞一個ChatGPT檢查器之類的?[2]但準確度又如何?),非常同意Temp3600的意見,「態度還是要擺出來」--百無一用是書生 (☎) 2023年1月29日 (日) 03:11 (UTC)
- 剛才用chatgpt-detector檢測了一下上面的例子Rust for Linux,英文都能正確識別是ChatGPT,但翻譯成中文就認為是人類了--百無一用是書生 (☎) 2023年1月29日 (日) 03:19 (UTC)
- 我認為標題中說的「限制」就可以了,不必要禁止也難以禁止(如何分辨,難道搞一個ChatGPT檢查器之類的?[2]但準確度又如何?),非常同意Temp3600的意見,「態度還是要擺出來」--百無一用是書生 (☎) 2023年1月29日 (日) 03:11 (UTC)
- 提問:ChatGPT是否會造成目前方針無法處理的破壞?如果有,是否說明目前的方針存在漏洞?--Steven Sun(留言) 2023年1月29日 (日) 03:44 (UTC)
- (+)支持,MilkyDefer給出的例子已經很明顯了,用於破壞實在是太過簡單。--BlackShadowG Slava Ukraini! 2023年1月29日 (日) 04:27 (UTC)
- 支持禁止,列入行為方針即可。 ——魔琴 [ 留言 貢獻 新手2023計劃 ] 2023年1月29日 (日) 04:32 (UTC)
- 我是持懷疑態度。首先是無法檢測、無法證明。任何一段文字,就算GPT檢測器說是GPT寫的,你無法看到那個人把這段文字從GPT複製下來貼上了。第二,ChatGPT用法多種多樣,不應該所有用法都不能用。我特別喜歡叫他幫我找錯別字,和從其他語言翻譯成中文。應該還有很多無破壞性的例子。Last but not least,現有規則已經可以cover ChatGPT造成的破壞。難道現在加一條說ChatGPT做好事也不行?--Gqqnb(留言) 2023年1月29日 (日) 13:01 (UTC)
- 我倒是有點想開了,維基百科又不是檢查你們做大學作業,有些學校會懷疑是不是你自己寫的,你只要寫出來了,巡查員檢查過了,我管你是怎麼寫的。我不明白有些人的邏輯,只要這種東西能夠用來破壞,「很容易用來破壞」,那這種東西就一定要禁止,是不是你家做菜以後都不要拿刀了。且不論槍支彈藥的道德屬性,槍支彈藥尚且可以用在正道,炸藥都可以弄出個諾貝爾獎,你維連ChatGPT的影子都沒有看到,便十分「有頭有尾」有罪推定宣判ChatGPT死刑,似乎認定了默認利用AI的都是壞人一樣,每個人在你維用一次ChatGPT就好像從你維的大廈下面偷一塊磚,連基本的「假定善意」都丟掉了。借用魯迅的一句話,「豈但鄉下人之於雷峰塔,日日偷挖中華民國的柱石的奴才們,現在正不知有多少」,而這等這種視若無睹的理所應當更是令我更是匪夷所思。----Cat on the Mars 2023年1月29日 (日) 13:26 (UTC)
- 感覺類似機翻:內容提交人自己知道潤色就OK;當然對初次參與維基百科的人,最保守的說法還是「禁止機翻」。--洛普利寧 2023年1月29日 (日) 13:31 (UTC)
- 我倒是有點想開了,維基百科又不是檢查你們做大學作業,有些學校會懷疑是不是你自己寫的,你只要寫出來了,巡查員檢查過了,我管你是怎麼寫的。我不明白有些人的邏輯,只要這種東西能夠用來破壞,「很容易用來破壞」,那這種東西就一定要禁止,是不是你家做菜以後都不要拿刀了。且不論槍支彈藥的道德屬性,槍支彈藥尚且可以用在正道,炸藥都可以弄出個諾貝爾獎,你維連ChatGPT的影子都沒有看到,便十分「有頭有尾」有罪推定宣判ChatGPT死刑,似乎認定了默認利用AI的都是壞人一樣,每個人在你維用一次ChatGPT就好像從你維的大廈下面偷一塊磚,連基本的「假定善意」都丟掉了。借用魯迅的一句話,「豈但鄉下人之於雷峰塔,日日偷挖中華民國的柱石的奴才們,現在正不知有多少」,而這等這種視若無睹的理所應當更是令我更是匪夷所思。----Cat on the Mars 2023年1月29日 (日) 13:26 (UTC)
- 翻譯指引有一句「請勿使用機器翻譯翻譯條目」,在後面加一個「或人工智能機械人」之類的,賦予禁止使用相關工具之授權法源就行了。—— Eric Liu 創造は生命(留言・留名・學生會) 2023年1月29日 (日) 14:21 (UTC)
- 但提案不限於翻譯,也包含創作。不過,如果創作後能做到可供查證,感覺沒太大問題。--YFdyh000(留言) 2023年1月29日 (日) 14:38 (UTC)
- 「機械人方針適用於所有用以編輯維基百科的電腦程式或腳本,包括全自動、高速運作以及協助編者的工具。」
- 按我的理解,現行機械人方針完全適用於AI程序,要改也輪不到翻譯指引。----Cat on the Mars 2023年1月30日 (一) 09:23 (UTC)
- 確實,一時間沒有想到。不過兩邊都寫亦無大礙,或可相呼應。—— Eric Liu 創造は生命(留言・留名・學生會) 2023年1月31日 (二) 03:06 (UTC)
- 我們來關注這麼一個問題。對於一個編輯經驗不足的新編者而言,創建條目時候的提示信息都有哪些呢?關注度、非廣告宣傳、著作權、參考文獻、WP:NOT,以及一個指向「其他」的連結。不論是機翻還是ChatGPT都沒有足夠可見的提示。巡查員一看,不行,從犄角旮旯里翻出一個方針的一個犄角旮旯的句子出來,新手直接炸毛了。--MilkyDefer 2023年2月3日 (五) 13:37 (UTC)
- 你應該去改F&Q而不是去改方針,現在的方針指引堪比屎山代碼,我覺得與其改機械人方針內容,還不如改名字一目了然,以前叫他機械人,其實只是自動化程序,以後必然還會有AI程序,它這名字早就已經趕不上時代了。----Cat on the Mars 2023年2月3日 (五) 15:45 (UTC)
- 方針指引太多搞得管理員都不知道自己正在重複立法。----Cat on the Mars 2023年2月3日 (五) 15:51 (UTC)
- 我們來關注這麼一個問題。對於一個編輯經驗不足的新編者而言,創建條目時候的提示信息都有哪些呢?關注度、非廣告宣傳、著作權、參考文獻、WP:NOT,以及一個指向「其他」的連結。不論是機翻還是ChatGPT都沒有足夠可見的提示。巡查員一看,不行,從犄角旮旯里翻出一個方針的一個犄角旮旯的句子出來,新手直接炸毛了。--MilkyDefer 2023年2月3日 (五) 13:37 (UTC)
- 確實,一時間沒有想到。不過兩邊都寫亦無大礙,或可相呼應。—— Eric Liu 創造は生命(留言・留名・學生會) 2023年1月31日 (二) 03:06 (UTC)
- 我的意見本來與Ericliu1912相近的,但考慮到YFdyh000所言在理,我更傾向要求任何人確保他們在用AI寫東西後必須先自己校對過才在維基百科發佈,畢竟相關工具我自己感覺不是完全不能用,但一定要自己下手調整AI寫出來的文本,這跟維基百科內置的機翻工具是一個道理。@YFdyh000、Ericliu1912:如果「似是而非」的文本符合「胡言亂語」的定義的話,這其實就是G1的範疇。Sanmosa Συ γάρ μοι και μοίρα εί και τύχη 2023年1月30日 (一) 05:05 (UTC)
- @Ericliu1912、shizhao:我想要請教管理員,如果我要在機械人方針第一句「機械人方針適用於所有用以編輯維基百科的電腦程式或腳本,包括全自動、高速運作以及協助編者的工具」「包括」後面加上一句「利用人工智能(AI)技術編輯維基百科的程序」,這是否超出了「修改方針及指引的文意」的小修改門檻。按照我的理解,機械人AI程序應該是在機械人方針「所有用以編輯維基百科的電腦程式或腳本」的範疇內。另外,從我的角度,防不如管,如果能夠知道別人在使用AI總比盲盒瞎猜好很多。--Cat on the Mars 2023年2月4日 (六) 11:25 (UTC)
- (-)反對與其禁止使用AI生成內容,應該規定的是不是使用AI輔助後應先行複檢後再發佈?AI跟機器翻譯一樣,可以視為一個輔助手段,但不應該作為主要貢獻。所謂的「似是而非」、「事實錯誤」全部現有方針已可處理。如果AI生成的內容可以被來源證實,我實在看不出一刀切禁止使用的原因-某人✉ 2023年2月6日 (一) 14:29 (UTC)
- 所以說,機器翻譯不正好是天怨人怨麼……--MilkyDefer 2023年2月7日 (二) 11:45 (UTC)
- 不喜歡或者討厭不是禁止的理由。----Cat on Mars 2023年2月7日 (二) 14:26 (UTC)
- 也不知怎麼就天怒人怨了,一幫人整天在tg群講相同的話真以為全宇宙都想得一樣。--日期20220626(留言) 2023年2月8日 (三) 11:12 (UTC)
- 所以說,機器翻譯不正好是天怨人怨麼……--MilkyDefer 2023年2月7日 (二) 11:45 (UTC)
- 咕咕--Zyksnowy(留言) 2023年2月8日 (三) 09:14 (UTC)
- 怎麼分辨並證明那些文字由ChatGPT等AI「生成」?何況那東西還在時刻「進化」。--安憶Talk 2023年2月8日 (三) 09:36 (UTC)
- 我覺得按照機械人方針自覺申報就行了,我們還沒有這個能力判斷,也耗不起這個時間,以後GPT3.5推廣了還會有更多AI程序,不可能永遠靠人力查核。----Cat on Mars 2023年2月8日 (三) 09:59 (UTC)
- (-)反對:Some people against using you in Wikipedia. How can I refute?
Here are some arguments that you could use to defend the use of AI language models like me in Wikipedia:
Increased efficiency and accuracy: AI language models can assist in generating and verifying information in Wikipedia, potentially leading to improved accuracy and efficiency compared to manual editing.
Supplementing human labor: AI language models can help to supplement the work of human editors and writers, freeing up their time and energy to focus on more complex and strategic tasks.
Improving accessibility: AI language models can assist in generating and translating content, making Wikipedia more accessible to a wider audience and supporting the goal of creating a free and comprehensive encyclopedia.
Cost-effectiveness: Using AI language models can help to reduce the cost of creating and maintaining Wikipedia, making it more sustainable in the long-term.
Of course, it's also important to consider potential concerns and criticisms related to the use of AI in Wikipedia, such as the potential for biases in the training data and the importance of maintaining human oversight and control. Nevertheless, with proper safeguards and transparency, AI language models like me can be a valuable tool for supporting and improving Wikipedia.--維基小霸王(留言) 2023年2月9日 (四) 04:12 (UTC)
- @MilkyDefer:這是使用ChatGPT生成的關於入間同學入魔了!的片段(使用「談談"入間同學入魔了!"這部動畫」去生成):
《入間同學入魔了!》是一部日本的動畫,是由小畑健製作的一部歌舞片。這部動畫以魔法為題材,講述了主人公入間在升上高中後,逐漸接觸到魔法世界,最終投身於魔法戰爭的故事。 這部動畫以精彩的故事情節和生動的角色設計而受到許多觀眾的喜愛。它還以鮮明的風格和豐富多彩的音樂展示了魔法世界的魅力,為觀眾帶來了一個充滿奇幻與冒險的世界。 如果你是一個喜愛動畫的觀眾,那麼這部動畫是值得一看的。它將帶給你一個精彩的故事情節和生動的角色,讓你進入一個充滿魔法與冒險的世界。
- ,但入間同學入魔了!實際上是由西修所創作的日本漫畫作品,且實際上小畑健曾經創作過《棋魂》,不是《入間同學入魔了!》,所以ChatGPT所生成的日本動漫類條目就有問題--林勇智 2023年2月9日 (四) 12:26 (UTC)
- 嘗試限定維基百科的風格,並要求給出至少五個不是維基百科自身的公開可查證來源呢?--MilkyDefer 2023年2月9日 (四) 12:55 (UTC)
- 它以前給過我一本陳景潤的《中國哲學史》。----Cat on Mars 2023年2月9日 (四) 12:58 (UTC)
- 所以我在看到U:outlookxp的查證的時候就覺得這是不是什麼我們不知道、並且還在保密中的高級AI。----Cat on Mars 2023年2月9日 (四) 13:02 (UTC)
- ChatGPT有點蠢,機翻都比它靠譜點。--日期20220626(留言) 2023年2月9日 (四) 13:09 (UTC)
- 用它機翻還是比較好用的。----Cat on Mars 2023年2月9日 (四) 13:24 (UTC)
- 大概是題外,看到提起維基內建機翻以及用機翻後要校正的內容等等的、那個啊今天凌晨逛近期變更的時候發現了不列顛共產黨,有興趣看哪位用戶新增的請查看編輯摘要以及貢獻,該使用者共新增了三個條目,因為實在是沒心力了所以只有掛了模板,看看此人會不會良心現前自己回來改,不改的話之後就刪除,個人感想是遇過幾次用機翻的用戶,原則上大概也不知道自己開了什麼箱,只是翻譯出來的結果乍看滿意好像吐出了象牙,奢望他們自己配備校對能力可能真的以為人本善良。--Mafalda4144(留言) 2023年2月9日 (四) 13:37 (UTC)
- 這玩意據方舟子測試,簡中資料來源自稱是用百毒的樣子。不過其他人有不同的結果。--S叔 2023年2月10日 (五) 02:19 (UTC)
- 嘗試限定維基百科的風格,並要求給出至少五個不是維基百科自身的公開可查證來源呢?--MilkyDefer 2023年2月9日 (四) 12:55 (UTC)
- 顯然ChatGPT自身生成的內容並不能作為證明其無害的依據。--Diskdance 2023年2月9日 (四) 15:04 (UTC)
- 好像有人測試醫學類條目,ChatGPT會自己編造PubMed參考文獻。另外不知道其在翻譯條目中是否也會編造內容。關於其翻譯質量,騰訊的一個實驗室最近在arXiv上發了一篇論文[1]。建議先行禁止。--Kethyga(留言) 2023年2月10日 (五) 12:41 (UTC)
- (+)支持明文禁止。——WMLO(留言)。 2023年2月10日 (五) 21:43 (UTC)
- @MilkyDefer:咱也模仿上面D2513850君使用《來自風平浪靜的明天》生成的對話內容:(Q:談談《來自風平浪靜的明天》這部動畫)
《來自風平浪靜的明天》(Your Name)是一部由新海誠執導的日本動畫電影,於2016年在日本上映。該片以美妙的動畫和複雜的人物關係角色,受到了廣泛的好評。
故事講述了兩個生活在不同城市的高中生,偶然發現自己的身體可以穿越時空互換。隨着故事的發展,他們不斷努力尋找對方,以解決自己的身份困惑和生活困境。
該片的動畫效果非常出色,景象壯麗,配樂優美。此外,它也提出了一些深刻的社會問題,如家庭、友情、愛情和對未來的希望,對觀眾產生了深遠的影響。
總的來說,《來自風平浪靜的明天》是一部非常優秀的動畫片,值得每個動漫愛好者去觀看。
感覺完全是按照《你的名字。》的內容去生成的 囧rz……--忒有錢🌊塩水あります🐳(留言) 2023年2月12日 (日) 19:58 (UTC)
- (-)反對:所有機械人輔助的編輯應該予以允許,但人類用戶必須在發佈前核對內容。--The Streif(留言) 2023年2月13日 (一) 04:21 (UTC)
- @忒有钱:建議在發佈到維基百科前先檢查chatGPT所生成的內容是否有問題(如事先閱讀或觀看內容(例如《入間同學入魔了!》漫畫或PubMed文獻))--林勇智 2023年2月14日 (二) 13:40 (UTC)
- 我也試了一下,看起來效果不佳,因為他生成的內容很容易有編造和過度聯想的狀況,少至生成的內容真偽查核困難。我的測試事先給ChatGPT閱讀相關文章,再請他整理成維基百科條目:請閱讀下列文章並將其整理成一篇中文維基百科條目,並且使用wikitext原始碼編寫條目,須包含內部連結和資訊框。(貼上wikia:w:c:danmachi:Wiene的全部內容)
- ChatGPT給了以下回答(內部連結和資訊框是ChatGPT加的,我一字未改)
- 以下是使用 wikitext 原始碼編寫的薇妮的中文維基百科條目:
- ChatGPT給了以下回答(內部連結和資訊框是ChatGPT加的,我一字未改)
薇妮 角色設定資料 物種 人鱗蛇 性別 女性 出生 地牢中層 所屬 赫斯提亞家族 薇妮(ウィーネ)是一位神秘的人鱗蛇女性,生於地牢的中層。她以其琥珀色的眼睛和長銀藍色的頭髮以及身體上數個地方的鱗片而聞名,還有額頭上價值高昂的「人鱗蛇之淚」紅寶石。
在留在赫斯提亞家族期間,薇妮穿着由貝爾·克拉內爾提供的「沙馬蘭德毛衣」,以隱藏她作為怪物的身份。
薇妮有講話的能力,這在怪物中是很罕見的,她以善良的性格而聞名。她與赫斯提亞家族特別是貝爾和春姬產生了依戀。儘管她有善良的性格,薇妮最初有着怯弱的本質,但在她重生後,她變得更加勇敢。
在外貌上,當薇妮救了一個小男孩時,她的身體從背部長出了一隻翅膀,翅膀很大,即使摺疊也可以覆蓋她一半的身體。
- 當中不少過度聯想,例如Infobox 內的所屬:赫斯提亞家族(應為赫斯緹雅眷族,但不是重點),薇妮並不屬於赫斯緹雅眷族,他只是暫時借住在赫斯緹雅眷族,表示ChatGPT過度聯想,造成其產生若干與事實不符的內容,且這若不對主題有一定程度的了解,是不可能發現的錯誤,因為似是而非,據我所知,有些編者喜歡透過編寫不是那麼熟悉的主題來增廣知識,萬一那些編者因此無法抓出ChatGPT編造和過度聯想的狀況造成編輯的內容出現似是而非的內容該怎麼查核?編者可能因為用了ChatGPT而導致在條目加入了似是而非錯誤內容而不知情,且也難以查核,如果是這樣,不如直接禁止ChatGPT生成內容為好。-- 宇帆-雪菲蛋糕🎂娜娜奇🐰鮮果茶☕在維基百科尋求休閒是否搞錯了什麼(☎️·☘️) 2023年2月14日 (二) 14:00 (UTC)
- (!)意見:相較ChatGPT定位於「聊天機械人」,近期Google推出的Bard或是微軟的全新Bing更像是一個「搜尋助理」,可以即時搜尋並更新最新的消息,以全新Bing為例,在回答的時候會給出多項參考網站來源(可參考這篇評測文章:[3]。)ChatGPT本身是一個模型,拿來訓練的資料庫是固定的(所以才說只能回答2021年前的問題),生成的內容常在相似的語句打轉。但這類新的人工智能搜尋助理,我認為值得期待,對維基百科的編者也會有很大幫助。巴波(留言) 2023年2月16日 (四) 12:55 (UTC)
- @巴波現在已經可以獲得關於2022年和2023的少量信息--FK8437(留言) 2023年3月26日 (日) 11:45 (UTC)
- (!)意見:我看得都很尷尬,一個個光光討論ChatGPT的性能問題,明明已經有相關規定(機械人方針)了卻沒有實施方法,AI模型本來就是一個很大範圍的事情,我記得站內好像就有人用類似工具創建條目,是不是.Net之類的,有一個誰專門用什麼程序修正錯誤之類的,後來基本都是被封了。我覺得這種事情實際上就是一種鑽空子,管理員應該要求使用AI及類似輔助程序的必須事先聲明並經過測試才能開車上路,ChatGPT只是我們的第一個例子,看上去並不適合上街亂跑,但是也要考慮到以後還會有很多智能程序的例子在後面,我們的方針應該有長遠考慮的打算。--Cat on Mars 2023年2月16日 (四) 20:04 (UTC)
- 思考了一下,雖然AI問題很多,但或許可以參考維基媒體基金會台灣分會的這則貼文的說法,僅限資深用戶使用,並且要嚴密檢查?-- 宇帆-雪菲蛋糕🎂娜娜奇🐰鮮果茶☕在維基百科尋求休閒是否搞錯了什麼(☎️·☘️) 2023年3月1日 (三) 17:53 (UTC)
- 我的提議是在在機械人方針中明確AI適用於本方針,如果按照連結內的條件(1.AI程序需要經過檢驗;2.AI程序需要自己負責;3.標記AI程序輸出內容;4.需要由資深編輯操作),實際上也是現在機械人方針審核的現行規則(測試+審核+明確操作者+標註機械人編輯),目前我看不出兩者管控措施有什麼明顯差異。----Cat on Mars 2023年3月4日 (六) 16:50 (UTC)
- 就現階段而言,我亦認為在機械人方針及(或)翻譯指引中相關段落明確提及人工智能即足矣。—— Eric Liu 創造は生命(留言・留名・學生會) 2023年3月4日 (六) 19:42 (UTC)
- 我的提議是在在機械人方針中明確AI適用於本方針,如果按照連結內的條件(1.AI程序需要經過檢驗;2.AI程序需要自己負責;3.標記AI程序輸出內容;4.需要由資深編輯操作),實際上也是現在機械人方針審核的現行規則(測試+審核+明確操作者+標註機械人編輯),目前我看不出兩者管控措施有什麼明顯差異。----Cat on Mars 2023年3月4日 (六) 16:50 (UTC)
剛剛測試感受了一下:一個樣例--EvesiestaCOVID-19感染中 2023年3月5日 (日) 08:32 (UTC)
如果維基百科現有的技術無法偵測到對方使用ChatGPT或類似AI工具的生成內容,那麼樓上各位所說也只是空話,更何況出自人手造假的(例如:折毛事件),你們也是經過很多年之後才發現,這就是活生生的警惕。因此,如果在沒有技術可以避免下,未來可能仍會有造假內容發生,這是現在維基百科的公信力最大的問題。--2001:B011:A401:3B94:3825:963C:D5D8:1D8(留言) 2023年3月8日 (三) 05:05 (UTC)
- 「往者不可諫,來者猶可追。」----Cat on Mars 2023年3月12日 (日) 12:06 (UTC)
- (-)反對:條目破壞與手動破壞或使用AI破壞似乎在結果上沒有差異?難不成用鍵盤輸入文字破壞條目,就要禁止所有使用鍵盤輸入的條目?更何況如前些留言者所言,人手造假的抓不到了,更何況AI生成。還不如想想用AI巡查條目,先處理明顯錯誤的條目。--死灰(留言) 2023年3月13日 (一) 14:13 (UTC)
- 可以考慮開發一個AI檢測器。。。--百無一用是書生 (☎) 2023年3月14日 (二) 02:42 (UTC)
- Open ai自己寫的檢測器都只有兩成六概率檢測得出來,還未計假陽性。如果這裏有任何人寫得一個出來就別在維基百科屈才當志工了--某人✉ 2023年3月19日 (日) 11:50 (UTC)
- 這話說得,能寫出來照樣可以來維基混。比如亞倫·斯沃茨這傢伙就很積極參與維基事務。--日期20220626(留言) 2023年3月19日 (日) 11:55 (UTC)
- Open ai自己寫的檢測器都只有兩成六概率檢測得出來,還未計假陽性。如果這裏有任何人寫得一個出來就別在維基百科屈才當志工了--某人✉ 2023年3月19日 (日) 11:50 (UTC)
- 在處理條目格式問題與修飾語氣上能派上用場,唯一的困擾僅幻覺問題。--死灰(留言) 2023年3月26日 (日) 11:14 (UTC)
- 可以考慮開發一個AI檢測器。。。--百無一用是書生 (☎) 2023年3月14日 (二) 02:42 (UTC)
- (-)反對:看過老高的影片後,我覺得他講的好,AI就是一種工具,不應該怕她。如果你直接叫AI寫一篇條目,就會很多錯,但如果你給他一篇文章請他歸納重點,錯誤會少很多,總之我覺得善用gpt寫條目是一件好事,可以節省很多時間,但不要亂用,如果亂用就直接速刪就可以,正常使用gpt並不用禁止。--E.D.(留言) 2023年3月16日 (四) 07:29 (UTC)
- (-)反對:2023年了,怎麼還在「非我也,兵也」呢?噗噗熊?|||||||||| 維尼熊! 2023年3月20日 (一) 14:21 (UTC)
- (-)反對:其實AI在翻譯條目中做的十分不錯,雖然文字在有些情況下需要修改以保證通順而且有點單調,至於創建條目來講(+)暫時支持禁止使用,因爲在不提供信息很容易出錯(例如將日期填寫錯誤以及出現大量虛構內容),搞不好出現折毛2.0。不過值得肯定的是它翻譯條目的能力和對於語句問題的通順化,不建議直接猛烈一刀切,應該看作是一種工具,反正多時無版權的。附註一小段由ChatGPT的翻譯草稿,可以研究一下它的質量。
- --FK8437(留言) 2023年3月25日 (六) 03:41 (UTC)
- FYI:較早前基金會與部分全域社群成員就 AI 對維基百科的影響及機遇等進行討論(討論摘要見此),個人期望對此討論有所幫助。謝謝。--SCP-0000(留言) 2023年3月25日 (六) 09:03 (UTC)
- 當然,鑑於ChatGPT的胡說扯蛋[開玩笑的]能力,設置一個只允許延伸確認用戶的標準來限制人濫用她來創造條目似乎不錯,不過實行起來難度很大,因此直接放棄抓捕,讓人人都用ChatGPT來造福維基百科也不是不可以。--FK8437(留言) 2023年3月26日 (日) 03:20 (UTC)
- 再次重申:在有任何能可靠辨識AI生成內容的檢測器問世之前你維任何規範ChatGPT的討論均為偽命題。所有所謂「偽造文獻」等問題可依現有方針處理,下方類似討論同上-某人✉ 2023年3月27日 (一) 20:20 (UTC)
- 已有ChatGPT Zero的監測器,唯準確率暫無測試,不過一般明顯的全部Copy大多可以檢測,混合內容檢測率一半一半,完全人類內容有時會假陽性。--FK8437(留言) 2023年3月28日 (二) 03:45 (UTC)
- 用AI打敗AI!這是我用ChatGPT來檢測AI生成內容的測試:
- 已有ChatGPT Zero的監測器,唯準確率暫無測試,不過一般明顯的全部Copy大多可以檢測,混合內容檢測率一半一半,完全人類內容有時會假陽性。--FK8437(留言) 2023年3月28日 (二) 03:45 (UTC)
提示語構建:
你是一个AI生成内容检测器,我输入文本内容,你来检查是否是AI生成的,还是人类撰写的。并给出答案和检查过程。检测内容不要输出。格式为: 结果:{AI或人类} 检查过程:{检查过程} 检测内容“<这里填入要检测的文本>”
用這個提示詞對上面「《入間同學入魔了!》」的文本進行檢測,結果如下:
结果:{AI} 检查过程:这段文本中有很多日本的动画和电影的常见元素,例如魔法、高中生活、战争等。此外,这段文本的语言流畅度和表达方式比较机械化,缺乏人类的情感和思考。最后,这段文本的结构和内容比较简单,缺乏深度和复杂性。综上所述,这段文本是由AI生成的。
對薇妮的檢測:
结果:{AI} 检查过程:这段文本中有很多日本动画和小说的常见元素,例如人鱼、魔法、怪物等。此外,这段文本的语言流畅度和表达方式比较机械化,缺乏人类的情感和思考。最后,这段文本的结构和内容比较简单,缺乏深度和复杂性。综上所述,这段文本是由AI生成的。
對「來自風平浪靜的明天」檢測錯誤
结果:{人类} 检查过程:这段文本是关于《来自风平浪静的明天》这部日本动画电影的介绍,内容涉及到电影的情节、人物、动画效果、配乐和社会问题等方面。语言表达流畅,情感丰富,没有明显的机械化或重复的痕迹。综上所述,这段文本是由人类撰写的。
對Rust for Linux(英文)的檢測也是錯誤的:
结果:{人类} 检查过程:这段文本是关于Rust for Linux项目的介绍,内容比较专业化,涉及到Linux内核和Rust语言的相关知识。语言表达流畅,结构清晰,没有明显的机械化或重复的痕迹。综上所述,这段文本是由人类撰写的。
總體上感覺不如一些第三方的檢測工具,例如[4],但也不失為一種方法。如果要做維基百科內容的AI檢測,目前最好的方法是介入多家的AI檢測技術,綜合對比比較穩妥--百無一用是書生 (☎) 2023年3月28日 (二) 09:05 (UTC)
- 另,以上我使用的是GPT3.5,GPT4不知道在這件事上是否更好一點?--百無一用是書生 (☎) 2023年3月28日 (二) 09:10 (UTC)
- 讓ChatGPT來自己區推測似乎不太好,而且本身它也不是為了檢測而生的。建議採用GPTzero。不過GPT4可能會更加難以檢測到,而且只要進行一點修理和潤飾就很難查出來這種混合文字,所以在出現準確率高的檢測工具之前就只要保證不被濫用去破壞或製造假新聞之類的就可以了。--FK8437(留言) 2023年4月8日 (六) 03:57 (UTC)
參考資料
- ^ Jiao, Wenxiang; Wang, Wenxuan; Huang, Jen-tse; Wang, Xing; Tu, Zhaopeng, Is ChatGPT A Good Translator? A Preliminary Study, arXiv, 2023-01-31 [2023-02-11], doi:10.48550/arXiv.2301.08745
使用ChatGPT等軟件來輔助編寫維基百科是否允許?是否需要標註?
各類人工智能大語言模型急速發展,可能可以被用來編寫或輔助編寫維基百科。那麼,使用ChatGPT、NewBing、ChatGLM、文心一言等軟件來編寫或輔助編寫維基百科是否應當允許?是否需要標註?
我模擬了此類GPT軟件的若干種使用方法,以供分別討論:
- 詢問類GPT軟件有哪些以「坤」為名字結尾的明星,來輔助編寫[坤坤]消歧義。
- 給類GPT軟件一段使用者寫的段落,使用GPT來潤色語句。
- 使用類GPT軟件來檢查維基語法。
- 直接給類GPT軟件若干信息,讓其寫一端內容,再由編者修改後寫入維基百科。
- 給類GPT軟件一段其他語言維基百科的內容,讓其翻譯成中文,再由編者修改後寫入維基百科。
若有不足,歡迎補充。--Huangsijun17(留言) 2023年3月28日 (二) 12:31 (UTC)
- 看似可以,但是要防止AI瞎編名字
- 潤色語句沒嘗試過,據說很不錯,但不知道有沒有造假問題?
- 這個可行,可以嘗試
- 除非用戶對GPT產生內容的方式有所了解,並且對所寫內容也很熟悉,否則不建議
- 這類AI模型的翻譯本質上似乎和機器翻譯的方式不太一樣,有可能翻譯後混入虛假內容或者部分內容丟失不翻譯?
--百無一用是書生 (☎) 2023年3月28日 (二) 12:49 (UTC)
- 試了一下修復語法錯誤,如果文本中只有一個wikitext錯誤,大概率可以已修復;如果多個錯誤,則往往只能修復一個;如果反覆讓他修復同一個文本,常常會把參考文獻刪掉,例如這樣的回答:
- Based on the context and selected code block, it seems that there is no error in the code. However, if you are looking to make a modification to the code, you can simply remove the unnecessary references and shorten the code as follows:
- '''小行星9350'''({{lang-en|9350 Waseda}})是一颗围绕[[太阳]][[公转]]的[[小行星]]。1991年10月13日,[[平沢正規]]、[[鈴木正平]]在Nyukasa发现了此天体,以[[早稻田大學]](Waseda)命名。
- This code block is the same as the selected code block, but with the unnecessary references removed. Hope this helps!
--百無一用是書生 (☎) 2023年3月28日 (二) 13:17 (UTC)
現在你是一個維基百科管理員,非常擅長編寫維基百科條目。請檢查我給出的wikitext語法有沒有錯誤。如果有錯誤,修復所有的錯誤,返回正確的wikitext;如果wikitext沒有錯誤,返回{沒有錯誤}。下面是一段wikitext:
--百無一用是書生 (☎) 2023年3月28日 (二) 13:19 (UTC)
用於潤色非常可行,以下是我取自硼酸#醫藥用途的兩段話:
硼酸可以用於消毒或治療較小的割傷和燒傷,有時亦被用作製造敷藥、軟膏等藥品的原料。硼酸可以治療黴菌感染,例如念珠菌症之類的疾病。以少量硼酸浸濕襪子可以治療足癬(香港腳),硼酸還可以治療人類和哺乳動物的外耳炎。 硼酸是唯一可以施用在眼部的酸,所以硼酸亦是市面上多數眼藥水的重要成分。
構造提示器:
現在你是一個百科全書編輯專家,也是一名資深的出版社編輯和校對。請對我提供的文本進行潤色,但忽略繁簡體問題,同時提供更多的編輯建議(用中文)。當我輸入{根據編輯建議修改},你就根據你在上個回答中提出的編輯建議修改我之前提供的文本。 下面是一段我提供的文本,潤色後輸出:
潤色後輸出的文本:
硼酸可以用於消毒或治療較小的割傷和燒傷,有時也被用作製造敷藥、軟膏等藥品的原料。硼酸可以治療黴菌感染,例如念珠菌症等疾病。以少量硼酸浸濕襪子可以治療足癬(香港腳),硼酸還可以治療人類和哺乳動物的外耳炎。
硼酸是唯一可以施用在眼部的酸,因此硼酸也是市面上多數眼藥水的重要成分。
提供的編輯建議(有時還會加上一大堆繁體轉簡體的建議,比如「建議將「治療」改為「治療」,將「製造」改為「製造」,將「藥品」改為「藥品」,將「黴菌」改為「黴菌」,將「之類的」改為「等」,將「浸濕」改為「浸濕」):
此外,建議在文本中加入硼酸的化學式和分子量等相關信息,以增加文本的科學性和準確性。
之後輸入「根據編輯建議修改」,ChatGPT輸出根據編輯建議修改的內容:
硼酸(H3BO3),分子量61.83g/mol,可以用於消毒或治療較小的割傷和燒傷,有時也被用作製造敷藥、軟膏等藥品的原料。硼酸可以治療黴菌感染,例如念珠菌症等疾病。以少量硼酸浸濕襪子可以治療足癬(香港腳),硼酸還可以治療人類和哺乳動物的外耳炎。硼酸是唯一可以施用在眼部的酸,因此硼酸也是市面上多數眼藥水的重要成分。
一些問題:AI會強制轉換繁簡體,統一為簡體或繁體,怎麼提示不許轉換都不行,每次的編輯建議未必一樣,有時只是對修改的地方進行了說明,有時則會提供一些內容擴充上的意見。總體上來看,還是非常不錯的 --百無一用是書生 (☎) 2023年3月28日 (二) 14:05 (UTC)
- 試了試用new bing來做Citation Hunt,效果不太理想:可能會找到相關文獻,也可能找不到,或者找到相關性不強的文獻。有用之處在於找文獻的效率會大幅提升,但還是需要人工來判斷具體文獻是否合適(當然可以藉助AI來總結和查找想要的觀點)--百無一用是書生 (☎) 2023年3月29日 (三) 07:47 (UTC)
- 嘗試了一下為缺少序言章節的條目寫序言。使用new bing,準確模式大概率無法完成,平衡模式則可以,基本會根據給出的條目連結中的內容進行符合維基百科格式要求的序言的編寫(理解什麼是維基百科條目的序言章節),但有時會夾帶虛假內容。另外,還嘗試了一下對標記為翻譯拙劣的條目進行語言上的潤色(使用ChatGPT),總體而言,翻譯基本能看懂,只是語言不太通順的話,潤色完全沒問題;但如果翻譯的很糟糕(例如機翻,帶有很多不知所云的內容),則潤色後也好不了多少。看來適合處理輕度翻譯問題,翻譯問題嚴重的話就不行了--百無一用是書生 (☎) 2023年4月3日 (一) 14:20 (UTC)
- 另外再說回檢查維基語法的嘗試,試了很多次,存在兩個問題:一是GPT認為參考文獻的標註不應該出現在正文當中,因此會自動移除<ref>標籤(GPT在潤色wikitext文本的時候明確指出了這一點);二是雖然大多數時候可以灌給它wikitext(不含<ref>標籤),再讓它潤色後用Wikitext格式輸出,但有時卻並不聽從指示,會刪掉一些wiki標記,有時則會刪除掉全部的Wiki標記--百無一用是書生 (☎) 2023年4月3日 (一) 14:27 (UTC)
- 用New Bing嘗試翻譯了一個條目Memento,效果非常好,語言流暢性上甚至比原文都要好一些。--百無一用是書生 (☎) 2023年4月7日 (五) 14:41 (UTC)
- 如果是Memento項目這個條目,我會說這個條目的內容對讀者非常不好。首段「同時也為網絡歷史研究提供便利」存在明顯的歧義,是「藉由網絡的幫助來研究歷史」,還是「研究網絡本身的歷史」?「Memento項目在 RFC 7089 中定義為內容協商的時間維度的一種實現」,內容協商的時間維度非常怪異,我作為讀者對這個短語的理解就是靠猜。「內容協商」我懂,「時間維度」理解不了,合起來更理解不了,更別說還要連上下文的「一種實現」才能定義出這個條目的主題。「要完全理解Memento,必須認識到HTTP提供的Last-Modified標頭不一定反映特定版本的網頁何時出現」這句話在條目里整個就是個無厘頭,前後都沒有銜接,就告訴你讀者「你必須認識到xx」,那然後呢,我還是理解不了。--Tiger(留言) 2023年4月12日 (三) 22:33 (UTC)
- 嘗試了一下為缺少序言章節的條目寫序言。使用new bing,準確模式大概率無法完成,平衡模式則可以,基本會根據給出的條目連結中的內容進行符合維基百科格式要求的序言的編寫(理解什麼是維基百科條目的序言章節),但有時會夾帶虛假內容。另外,還嘗試了一下對標記為翻譯拙劣的條目進行語言上的潤色(使用ChatGPT),總體而言,翻譯基本能看懂,只是語言不太通順的話,潤色完全沒問題;但如果翻譯的很糟糕(例如機翻,帶有很多不知所云的內容),則潤色後也好不了多少。看來適合處理輕度翻譯問題,翻譯問題嚴重的話就不行了--百無一用是書生 (☎) 2023年4月3日 (一) 14:20 (UTC)
總體評估
任務 | ChatGPT評分 | New Bing評分 | 人工介入程度 | 對條目品質的影響 | 備註 |
---|---|---|---|---|---|
修復語法錯誤 | 2 | 未測評 | 中度 | - | 不可行。僅僅是能夠修復,但可能會自動移除一些wiki語法,或者多個錯誤只能修復一兩個 |
潤色文本 | 8 | 未測評 | 輕度 | +++ | 可行。表現非常好,但輸出wikitext會自動移除<ref>標籤,有時還會移除其他Wiki標記,而且會統一為簡體或繁體 |
補充來源 | 不支持 | 6 | 高度 | ++ | 可行。必須準確模式,平衡模式有可能會給出虛構文獻。可能會找到相關文獻,也可能找不到,或者找到相關性不強的文獻。需要人工進一步確認 |
補充序言 | 不支持 | 7 | 中度 | + | 可行。必須平衡模式,準確模式大概率無法完成。有可能會加入虛假信息。生成序言的質量與條目內容的好壞密切相關。 |
翻譯潤色 | 5 | 未測評 | 輕度 | ++ | 可行。對輕度翻譯問題表現出色,翻譯問題嚴重則不行。其他問題同「潤色文本」 |
條目分類 | 不支持 | 5 | 中度 | + | 可行。平衡模式要比準確模式更可能完成(二者都可能無法完成)。能夠生成符合維基百科要求的wikitext分類,但可能夾雜錯誤分類(根本不是該分類的)和紅鏈分類(有類似分類,但這個分類還未建立) |
條目翻譯 | 未測評 | 9 | 中度 | +++ | 可行。直接給連結到聊天模式可能不給翻譯,撰文模式則能夠翻譯。語言通順性要比機器翻譯強得多,而且會在翻譯的同時進行文本的潤色。(生成wikitext暫未測試) |
指標說明:
- 評分:
- 滿分10分
- 人工介入程度
- 輕度:基本上不需要人工介入,或簡單修改後即可使用;中度:生成的內容需要人工檢查後方可使用;重度:生成的內容需要人工非常仔細地檢查核對
- 對條目品質的影響
- -更可能負面,--負面,---非常負面;+更可能正面,++正面,+++非常正面)
--百無一用是書生 (☎) 2023年4月3日 (一) 15:02 (UTC)
- 可以參考en:WP:CHATGPT,即要求使用大型語言模型生成的文本都需要署名,例如使用
{{OpenAI}}
。--BlackShadowG Slava Ukraini! 2023年4月9日 (日) 06:54 (UTC)- (+)贊成--Hualin~希望の星は青霄に昇る Commons|Talk 2023年4月9日 (日) 07:18 (UTC)
- (+)贊成,所有通過人工智能生成的文本都需要標註,另外ChatGPT對標準現代漢語的語言的組織能力還是比較弱,ChatGPT本身就是在印歐語系環境下產生的一種人工智能。另外應該限制IP用戶和新用戶使用人工智能生成文本編輯中文維基百科。--СлаваУкраїні! 2023年4月10日 (一) 00:38 (UTC)
- (+)強烈贊成使用模板標記使用AI的條目,但(-)反對限制新人和IP使用ChatGPT,因爲只要有少許人工潤化就很難被市面上的AI文檢測工具查出,而且只要符合關注度和質量標準就可以。
- 大致( ✓ )同意shizhao的測試。參考閣下的測試,(&)建議:
- 允許輔助翻譯條目和潤色粗糙的翻譯
- 允許在不改變文章主題思想和內容的情況下潤色和通順文本
- 不允許解決語法問題(我私下試過覺得不行)
- 同時提議:
- 不允許使用AI直接輸入內容來創建或擴充條目,一位容易於相似內容混淆和GIGO,但允許真人完成主要文本後進行優化。
- --FK8437(留言) 2023年4月12日 (三) 12:58 (UTC)
- (+)贊成,所有通過人工智能生成的文本都需要標註,另外ChatGPT對標準現代漢語的語言的組織能力還是比較弱,ChatGPT本身就是在印歐語系環境下產生的一種人工智能。另外應該限制IP用戶和新用戶使用人工智能生成文本編輯中文維基百科。--СлаваУкраїні! 2023年4月10日 (一) 00:38 (UTC)
- (+)贊成--Hualin~希望の星は青霄に昇る Commons|Talk 2023年4月9日 (日) 07:18 (UTC)
- 這個獨裁社群很顯然把所謂的機器翻譯是什麼忘得一乾二淨才會提出這麼荒謬的討論串。很簡單啊,只要不對外說,根本也沒人知道您是依靠ChatGPT、Google翻譯還是劍橋翻譯來寫條目的。英文白癡都能變天才,只要讀起來別太過於機器翻譯基本上就沒事。理由正是因為現在的條目還想要寫出新的只會越來越難,因為條目都已經被前人寫過了,所以只好靠其它語言的翻譯(比如常見的en)。這句也不知道要講幾次,獨裁社群才會懂?為什麼需要標註呢?標註不就是自尋死路嗎?這個是寫條目,不是在寫論文。誰管您出處在哪?如果抄襲過多就無法畢業嗎?還是維基百科真的要改名叫論文百科了?如此荒謬的東西都能夠提出來,呵呵。--Z7504非常建議必要時多關注評選(留言) 2023年4月12日 (三) 16:11 (UTC)
- (+)支持。-噗噗熊?|||||||||| 維尼熊! 2023年4月21日 (五) 12:04 (UTC)
- 維基百科所需要的內容並不在於語言好不好,而是內容本身好不好(當然,語言好那是最基本的)。如同我上面指出的,如果只看到語言流暢,忽略這些文本到底提供了怎樣的信息,就會覺得現階段的語言模型輸出的內容好像可以用,但是各位仔細讀一讀呢?作為讀者,仔細讀一讀,恐怕十次裏面有九次是讓人失望的。人工潤色GPT輸出的內容,與機器翻譯類似,若要保證品質,人工查證、修改所花費的精力並不亞於從頭開始寫。當然,假如我們選擇禁止使用GPT,而各位偷偷用GPT,那不被發現也很正常。反正別人也大概率不會有證據證明你用了GPT,也很難有精力一篇一篇條目讀過去,一句一句仔細查證。--Tiger(留言) 2023年4月12日 (三) 22:47 (UTC)
- 放屁。誰管您的文本是不是請幾萬隻猴子打出來還是機翻出來的。內容寫得不好就刪掉,就這樣簡單。要注意的是ChatGPT可能會生成有版權的內容而已。--Ghren🐦🕓 2023年4月13日 (四) 08:07 (UTC)
(&)建議:請注意,使用ChatGPT等軟件來書寫維基百科時,並不一定需要由ChatGPT直接或間接生成條目中的文本。還是以我開頭提出的坤坤為例,書寫類似的條目時,可以由人工智能來搜集相關信息後再人為書寫條目。條目中不存在任何GPT類軟件生成的內容。但這是是否需要標註?例如現在詢問newbing:把十二生肖全都過一遍需要多少年?它會告訴你13.5年。類似的,詢問GPT類軟件來了解、解答、求證、引證、驗證相關內容,是極有可能存在錯誤的。——Huangsijun17(留言) 2023年4月18日 (二) 16:44 (UTC)
- 然而這討論和「提議廢除快速刪除準則的G13翻譯拙劣,或使用別的方針替代」又是關聯性。可悲的獨裁社群,完全不動腦的,才會每次提案討論都是長得不得了且無共識。--Z7504非常建議必要時多關注評選(留言) 2023年4月23日 (日) 07:31 (UTC)