男同 打屁股 谷歌、微软包下核电站“囤电”,AI技艺除外的逆境被低估了
AI 发展耗能弘大男同 打屁股,影响可持续性及社会。
AI 的发展给东谈主们描写了科技越过带来的"诗和远处",但这背后却有着弘大的能源、资源、劳能源糜掷,这是 AI 发展的千里重推行。
此外,AI 行为一种新式"巨机器"对东谈主和社会的影响也被低估了。
2018香蕉在线观看视频谷歌在本周一暗示,与 Kairos Power 公司签署一份从多个微型模块化反应堆购买电力的条约,以满足发展东谈主工智能的用电需求。
谷歌蓄意买六到七个微型模块化反应堆的电力,合计 500 兆瓦,首个微型模块化反应堆在 2030 年之前参加使用。
而在上个月月底,微软和星座能源公司签署了一份为期 20 年的电力采购条约,蓄意重启曾因严重核事故而关闭的好意思国三哩岛核电站。
1979 年 3 月 28 日,三哩岛压水堆核电站的二号反应堆由于冷却系统失灵,形成 62 吨的堆芯熔毁事故,这是东谈主类核能发展史上发生的第一皆堆芯熔毁事件。
海外上把核电站事故分为 7 级,切尔诺贝利和福岛的核事故是唯二的两件 7 级事故,而三哩岛核露馅处于第 5 级。
星座能源在 1999 年买下了一号反应堆,就在发惹事故的二号反应堆傍边,自后因为经济效益不好在 2019 年关闭了。
跟微软签条约后,星座能源将参加 16 亿好意思元对一号反应堆进行翻新,预测到 2028 年才开动从头发电,时候表受到监管批准的影响。
谷歌、微软搬出来核电站,一下子囤这样多电,主要将用来驱动 AI 数据中心。何况不单这两家,其他在 AI 规模布局的科技大佬都在这样干。
本年 3 月,亚马逊从塔伦能源公司购买了一个自带核电供应的数据中心园区;甲骨文最近也暗示,正在假想 1 处由 3 个微型核反应堆供电的数据中心。
科技巨头之是以搞得这样大,是因为 AI 恐怖的耗电量。
AI 究竟有多耗电?
斯坦福东谈主工智能有计划所发布的《2023 年东谈主工智能指数报告》显露,OpenAI 的 GPT-3 单次老到耗电量高达 128.7 万度,独特于 3000 辆特斯拉 Model Y 跑满 32 万公里的耗电量。这亦然 120 个好意思国度庭 1 年的用电量。
这还仅仅老到用的电,比拟背面连接使用的枢纽仅仅小头。
在使用枢纽,AI 每次作出薪金也要多数耗电。像 ChatGPT 有 2 亿多用户,每天反应这些需求就要耗 50 万度电。
大模子的参数目越大,需要处理的数据就越多,所需要的筹画量就越大,而算力背后是多数的服务器、存储开荒和蚁集开荒,它们昼夜不竭地责任,糜掷多数电能。
曾有业内东谈主士暗示,国内一线大模子的运营本钱中,电费占到了总本钱的 50% 以上。
海外能源署本年发布的报告中预测,将来三年大师对数据中心、加密货币和东谈主工智能的电力需求将加多一倍以上,独特于一个德国的全部电力需求。
"我在一年多前就预测过芯片短缺,下一个短缺的将是电力。我以为来岁将莫得迷漫的电力来运行扫数的芯片。"前段时候马斯克发出了这样的预警。
OpenAI 首席实施官山姆 · 奥特曼也暗示,东谈主工智能将糜掷比东谈主们预期更多的电力。
若是说算力是大模子的底层复旧,那电力等于算力的底层营救。能否获取更清洁、褂讪的能源,以及 AI 开荒能否作念到遵循更高、更省电,影响着 AI 发展的可持续性。
除了耗电,AI 对资源也有着多数糜掷。
比如对水资源的糜掷。AI 芯片制造流程中触及多数的清洗和化学处理才能,坐褥一个智妙手机芯片就需要苟简糜掷 5 吨多的水。而 AI 超算数据中心也需要多数水来散热,有计划发现,单是使用 GPT-4 生成 100 字文本就需要糜掷多达三瓶水。
有调研估算,到 2027 年男同 打屁股,大师范围内的 AI 需求可能需要糜掷掉 66 亿立方米的水资源,独特于杭州西湖水量的 450 多倍。
还有矿产资源,任何高技术的首先都是能源和矿产。
从蚁集路由器到电板再到数据中心,AI 系统膨胀蚁集中的每一部分都需要矿产资源。
当代生活的许多方面都被更动到了"云表",但东谈主们很少琢磨这些原材料的本钱。咱们的责任、生活、舒适文娱大部分都发生在蚁集筹画架构的天下,而由云筹画联通的咱们拿在手中的开荒,其内核为锂。
可充电锂离子电板是移动开荒、札记本电脑、家用数字助理和数据中心备用电源的必需品。它们营救着互联网和互联网上运行的的确扫数买卖平台。
除此除外,还有许多不行再生的矿物资参与到了 AI 和其他高技术发展中,包括用于 iPhone 扬声器和电动汽车电机的稀土元素镝和钕,用于士兵的红外军事开荒和无东谈主机的锗,不错提升锂离子电板性能的钴。
参与天下科技竞争的国度都会字据本人工业要乞降对供应风险的计谋评估,制定我方的要害矿物清单。
中国、好意思国、欧盟计谋性要害矿产(图源:海外联接中心网站)
锂、锗、钴、稀土、石墨等都位列其中,是发展新能源汽车、东谈主工智能、云筹画、光伏、信息通讯等高技术不行或缺的。
像稀土,内部包含 17 种金属元素,16 种被用在了智妙手机里,这些元素不错在彩色显露屏、扬声器、相机镜头、可充电电板、硬盘驱动器和其他许多组件中找到。
若是无法保证这些矿物的供应,包括 AI 在内的科技行业都将堕入停滞。这是技艺发展最迫切的管理条目。
许多矿产都分散于天下上比较偏僻或者经济不发扬地区,像玻利维亚西南部的乌尤尼盐沼、刚果中部、蒙古国、印度尼西亚。而采矿历来都是一件极易激励地缘政事冲破和干戈的事情。
但包括 AI 在内的高技术发展给咱们带来了"诗与远处",很容易让咱们忽略组成技艺"肉身"的这些原材料,背后的稀缺,以及由此带来的冲破、饥饿和艰巨。
正如"锂电板之父"古迪纳夫所担忧的那样:"锂的迫切性不亚于石油等计谋性资源,一朝开采出现瓶颈,可能会跟石油相通成为干戈的导火索。"
这样看来,高技术的确也不错看作是一种资源密集型的索要技艺,把不行再生的矿产、水等滚动一些杜撰才调,时代还伴跟着环境龙套和地缘冲破。
何况,这种弘大的资源密集型基础按次的真实足是私东谈主的。
AI 发展不仅存在能源和资源"饥渴",还存在数据"饥渴"。
数据、算法和算力是 AI 大模子的三大支撑,而数据是大模子进行老到的根基。数据集塑造了 AI 的知道规模,它们决定了 AI "看"天下的界限。
比如,创建筹画机视觉系统的第一步,往往是从网上抓取千千万万致使数百万张图像,然后设置一系列分类体系来对它们进行排序,并以此行为系统感知可不雅察事实的基础。
若是念念构建一个不错检测苹果和橙子图片之间互异的机器学习系统,当先开发东谈主员必须采集和象征数以千计的苹果和橙子的图像,并基于此老到神经蚁集。在软件方面,算法会对图像进行统计探问,并开发一个模子来识别两个"类别"之间的互异。
若是一切按蓄意进行,经过老到的模子将能够辞别它夙昔从未碰到过的苹果和橙子图像之间的互异。
但若是扫数苹果的老到图像都是红色的,而莫得一个是绿色的,那机器学习系统可能会臆想"扫数苹果都是红色的"。青苹果实足不会被识别为苹果。
因此,老到数据集是大多数机器学习系统进行推理的中枢。它们是 AI 系统用来生成预测基础的主要原材料。
当今蚁集上每天有不行胜数的文本、图片、音视频被上传,AI 参与者就开动了数据劫夺。
科技巨头在其中占据了上风地位,像腾讯、字节、Meta 等掌持着各自的数据渠谈,共享内容的东谈主越多,他们能用来老到大模子的力量就越大。东谈主们很乐意免费为他们的像片贴上姓名和场合的标签,而这种无偿作事为机器视觉和话语模子系管辖来了更准确的象征数据。
莫得这些数据渠谈的企业就要为此付一大笔用度或者念念其他想法得到。
OpenAI 就曾被报谈其在未得到创作家授权情况下,使用 Whisper 语音识别器用,转录了杰出一百万小时的 YouTube 视频内容,并将这些数据用于老到其 GPT-4 模子。
但数据,尤其是高质地的数据并非取之不尽用之不竭的。字据旧年 Epoch AI 东谈主工智能预测组织的一项有计划,AI 公司可能在 2026 年前耗尽高质地文本老到数据,而低质地文本和图像数据的穷乏时候可能介于 2030 年至 2060 年之间。
山姆 · 奥特曼曾以为 AI 终末应当不错产生高品性的"东谈主造贵寓",以便高效地进行自我培训。
但许多有计划者以为,AI 产生的数据质地太差,再用这样的数据"喂"我方等于"自我投毒"。
对高质地数据的饥渴催生了" AI 灌音员""大数据标注师"" AI 裁剪"等众包责任。
之前就有媒体报谈,在一些一二线城市,互联网大厂正以每次 300 元的价钱,招募" AI 灌音员"。他们的任务是为大模子提供定制化的语音数据,通过录制长达 3 小时的对话,匡助 AI 更好地阐发和学习东谈主类话语。
这 300 元不是那么好挣的,需要提供有充足剧情、严格合适程序的高质地内容,可能需要屡次重叠一些内容以合适要求。
事实上,AI 的一个常被冷漠的紧要事实等于需要数目弘大的低薪工东谈主匡助开发、保重和测试 AI 系统。比如 AI 灌音员,还有给数千小时的培训数据作念象征,审查可疑或无益的内容。但他们从未因为使这个 AI 系统泛泛运行而获取招供。
此外,像亚马逊的物流系统,即便配备了多数机器东谈主来作念诸如搬箱子这样的重活,但也需要东谈主来配合完成机器东谈主作念不了的格外、密致的责任,比如机器东谈主识别不了的殊形怪状的东西。
东谈主去配合机器东谈主,就要连接妥贴机器东谈主,还要按照机器的节律,很难期骗我方已有的常识或形成责任惯性。
这显露出了 AI 发展初期东谈主的鼎新,把东谈主的作事和价值之间进行脱节,从而更好地配合机器,也更容易被替代。
而 AI 大多数老到集是在东谈主们不知情或未经当事东谈主容或的情况下构建的,像家里的智能音箱、口袋里的手机、智妙腕表、监控纪录下的面部神志等,会不会也被拿来行为数据老到 AI?
图源:《我 , 机器东谈主》
机器学习模子需要持续的数据流才能变得愈加准确。但机器只可渐近,始终不会达到实足精确,这进一步鞭策算法从尽可能多的东谈主身上索要信息,来为东谈主工智能提供"燃料"。东谈主类主体性被进一步消解。
写下这样多并不是"反技艺",恰巧相背,技艺给东谈主类带来了诸多便利,创造了更多可能性,使东谈主类开脱了诸多生活和发展难题。
但技艺背后是一个触及能源、资源、东谈主、社会、历史等各方面的系统性问题。
正如社会学家凯特 · 克劳福德在其所著《技艺除外:社集积存中的东谈主工智能》中以为,东谈主工智能既是具身的,亦然物资的,由当然资源、燃料、东谈主力、基础按次、物流、历史和分类组成,这些都是需要付出代价的。
但很彰着,当下东谈主们更多追求技艺的武备竞赛和技艺狂欢,而忽略了技艺除外的一系列问题。
尤瓦尔 · 赫拉利在《当天简史》里说,19 世纪工业立异兴起之后,其时的社会、经济和政事款式都无法应酬联系的新情况和新问题。封建主义、帝王制和传统宗教不妥贴解决工业大都市、几百万抛妻弃子的工东谈主,并濒临当代经济连接变化的骨子。
狄更斯笔下的煤矿童工、第一次天下大战和 1932 — 1933 年的乌克兰大饥馑,都仅仅东谈主类付出兴盛膏火的一小部分。
当代精良有核火器及多样更高档的技艺,龙套力也更惊东谈主,咱们只可比濒临工业立异时作念得更好才行。
东谈主类的行进既充满机灵,又是盲想法。作念任何事都有代价,粗略最优的竣事是遵循和代价匹配,而非不计代价地奔向方针。
本文来自微信公众号"商隐社"(ID:shangyinshecj)男同 打屁股,作家:浩然。