• 国际葡萄酒设备技术展亮相宁夏 本土高科技产品引瞩目 2019-07-20
  • 【三年决战奔小康】一封来自甘南精准扶贫户的感谢信 2019-07-20
  • 当今的公知精英都引导人产生一个共识:干什么都不重要,钱就是“事业和面子”。为了钱,出售自己,很现实。因此,许许多多的人只“信仰人民币”。 2019-07-06
  • 这5棵“中国最美古树”在西藏 2019-07-04
  • 香港海上龙舟队:同舟共济 拼尽全力 2019-07-02
  • 置之无形之中听惊雷! 2019-06-11
  • 新疆铁路端午小长假加开41列旅客列车 2019-06-09
  • 说的有道理 。说明我们的教育方向确实是有问题,毛主席当年对教育领域的有关指示是正确的。 2019-06-09
  • 人民日报发喜报庆祝我国第一颗氢弹爆炸成功 2019-05-30
  • 96次航拍峨眉 换个角度看巴蜀名山 中国国家地理网 2019-05-30
  • 陈秋冬:评估AI项目 我们需要思考三个问题 2019-05-03
  • 浙江:大学生就业实习平台启用 2019-05-03
  • 人民日报人民时评:个人信息,利用好更需保护好 2019-04-21
  • 山西临汾:壶口瀑布奔腾咆哮奇景 2019-04-21
  • 蔡徐坤粉丝破千万送福利 帅气运动装长腿吸睛 2019-04-17
  • 当前位置:上海天天彩4开奖结果 >  域名 >  正文 > 维修工是世界上最强的工种,维修人的出路在哪里呢?

    上海天天彩4开奖结果 www.rl-f1.com   交易 任务 SEO服务 站长团购 联盟

    独孤博这个老毒物在放毒的时候绝对是极其狡诈的,他这毒素还没有朝着那些魂斗罗的方向释放,实力越强的魂师,越容易发现他的行动,他的目标就只是那些数量庞大但大多数都是七十级以下的中低级魂师而已。一丝邪恶的笑容已经渐渐出现在独孤博脸上。

    今年Instagram最热门的10大旅游地,你去过哪几个?

    明珠见李庆安没有怪自己的意思,也没有问自己为什么来,她心中的紧张稍稍平息,便嫣然一笑道:“前两年去安西住了半年不是,在安西学会喝酒了?!?br/>“贝卡斯好厉害,没了千年眼他居然还这么的厉害,居然挡住了刘皓的陷阱魔法加上怪兽的攻击还借此机会伤到了刘皓,真的是很难对付?!庇蜗钒迪?。

    “就是这里没错了?!卑沟滤鼓贸隽颂旎?,发现一直毫无反应的天机图在这一刻忽然绽放出耀眼的光芒放佛和什么东西,什么力量产生了奇异的共鸣一般。

    星际2玩家们,你们很快就会在天梯上为DeepMind的论文做贡献了


    雷锋网 AI 科技评论按:昨晚,暴雪联合 DeepMind 发出一则新闻,DeepMind 开发的星际 2 AI「AlphaStar」很快就会出现在星际 2 欧洲服务器上的 1v1 天梯比赛中。人类玩家们不仅会有机会匹配到它们、和它们展开标准的比赛,比赛结果也会像正常比赛一样影响自己的天梯分数。

    在星际 2 上做科研实验

    正如人尽皆知的围棋 AI AlphaGo,DeepMind 喜欢的强化学习 AI 研究过程是在某个比赛(博弈)环境中进行技术探索,在新技术的辅助下让智能体从历史数据中学习、从自我博弈中学习,然后与人类高手比赛,评估 AI 的水准。樊麾、李世石、柯洁都光荣地成为了「人工智能测试高级工程师」。

    在此次星际 2 AI「AlphaStar」的研究过程中,DeepMind 继续沿用这个思路,但这次他们更大胆一点,让大批不同水准的普通玩家参与到 AI 表现的评估中来,最终的比赛结果会写到论述星际 2 AI 科研项目的论文里,向期刊投稿。这就是暴雪和 DeepMind 联手把 AI 送上天梯比赛的最重要原因。

    进入星际 2 游戏,在 1v1 比赛设置了允许接入 DeepMind(DeepMind opt-in)之后,参加 1v1 天梯比赛的玩家们就可能会遇到 AlphaStar。为了控制所有的比赛都尽量接近正常的人类 1v1 天梯比赛,以及减小不同比赛之间的差异,AlphaStar 会随机匹配到一部分玩家的天梯比赛中,并且 AI 会在游戏保持匿名,匹配到的玩家和星际 2 后台都无法知道哪些比赛是有 AlphaStar 参与的。不过,设置了允许接入 AI 之后,相信玩家们立即就会开始对匹配到 AI 对手产生期待,而且在比赛开始之后也可能很快就会发现自己的对手有一些不寻常之处。

    一月的比赛中,AlphaStar 会建造大量工人,快速建立资源优势(超过人类职业选手的 16 个或 18 个的上限)

    一月的比赛中,AlphaStar 控制的两个追猎者黑血极限逃生

    今年一月时 AlphaStar 就曾与人类职业选手比赛并取得了全胜。相比于当时的版本,此次更大规模测试的 AlphaStar 版本进行了一些改动,其中一些改动明显对人类有利:

    一月的版本可以直接读取地图上所有的可见内容,不需要用操作切换视角,这次需要自己控制视角,和人类一样只能观察到视野内的单位,也只能在视野内移动单位;

    一月的版本仅使用了神族,这次 AlphaStar 会使用人族、虫族、神族全部三个种族;

    一月的版本在操作方面没有明确的性能限制,这次,在与人类职业选手共同商议后,对 AlphaStar 的平均每秒操作数、平均每分钟操作数(APM)、瞬时最高 APM 等一些方面都做了更严格的限制,减少操作方面相比人类的优势。

    参与测试的 AlphaStar 都是从人类比赛 replay 和自我比赛中学习的,没有从与人类的对局中学习,同时 AlphaStar 的表现会在整个测试期间保持不变,不进行训练学习;这样得到的测试结果能直接反应 DeepMind 目前的技术水准到达了怎么样的水平。另一方面,作为 AlphaStar 技术方案的一大亮点,参与测试的 AlphaStar 也会是 AlphaStar 种群(AlphaStar league,详见下文)中的多个不同个体,匹配到的不同 AlphaStar 个体可能会有迥异的游戏表现。

    AlphaStar 技术特点

    在今年一月 DeepMind 首次公开 AlphaStar 与人类职业选手的比赛结果时,雷锋网 AI 科技评论就结合 DeepMind 官方博客对 AlphaStar 的技术特点进行了报道。这里我们再把 AlphaStar 的技术特点总结如下:(详细可以参见文章)

    模型结构 - AlphaStar 使用的是一个长序列建模模型,模型从游戏接口接收的数据是单位列表和这些单位的属性,经过神经网络计算后输出在游戏中执行的指令。这个神经网络的基础是 Transformer 网络,并且结合了一个深度 LSTM 网络核心、一个带有指针网络的自动回归策略头,以及一个中心化的评分基准。

    AlphaStar league 中的个体形成了明显的策略分布

    训练策略 - AlphaStar 首先根据高水平人类比赛进行监督学习训练(模仿学习),然后进行自我对弈。自我对弈的过程中使用了群体强化学习的思路:AlphaStar 自我对弈过程中始终都同时记录、更新多个不同版本的网络,保持一个群体,称作 AlphaStar league;AlphaStar league 中不同的网络具有不同的对战策略、学习目标等等,维持了群体的多样性,整个群体的对弈学习保证了持续稳定的表现提升,而且很新的版本也不会「忘记」如何击败很早的版本。

    训练结果输出 - 当需要输出一个网络作为最终的训练结果时,以 AlphaStar league 中的纳什分布进行采样,可以得到已经发现的多种策略的综合最优解。

    算力需求 - 为了支持大批不同版本 AlphaStar 智能体的对战与更新,DeepMind 专门构建了一个大规??赏卣沟姆植际窖盗坊肪?,其中使用了最新的谷歌 TPUv3。AlphaStar league 的自我对战训练过程用了 14 天,每个 AlphaStar 智能体使用了 16 个 TPU,最终相当于每个智能体都有长达 200 年的游戏时间。训练结束后的模型在单块消费级 GPU 上就可以运行。

    操作统计 - 在今年一月的版本中,AlphaStar 的平均 APM 为 280,峰值 APM 超过 1000,计算延时平均为 350 毫秒;切换关注区域的速度大约是每分钟 30 次。

    此次在 AlphaStar 中测试的大行动空间下的长序列建模,以及群体强化学习的训练策略,都是对提升强化学习算法表现上限、应对复杂环境长期任务的积极技术探索。我们期待早日看到 DeepMind 的这篇论文成文,更早日看到基于强化学习的决策系统整个领域都发展得更成熟。当然了,喜欢星际 2 的读者,可以准备起来,为 DeepMind 的这篇论文贡献自己的一分力量吧!

  • 国际葡萄酒设备技术展亮相宁夏 本土高科技产品引瞩目 2019-07-20
  • 【三年决战奔小康】一封来自甘南精准扶贫户的感谢信 2019-07-20
  • 当今的公知精英都引导人产生一个共识:干什么都不重要,钱就是“事业和面子”。为了钱,出售自己,很现实。因此,许许多多的人只“信仰人民币”。 2019-07-06
  • 这5棵“中国最美古树”在西藏 2019-07-04
  • 香港海上龙舟队:同舟共济 拼尽全力 2019-07-02
  • 置之无形之中听惊雷! 2019-06-11
  • 新疆铁路端午小长假加开41列旅客列车 2019-06-09
  • 说的有道理 。说明我们的教育方向确实是有问题,毛主席当年对教育领域的有关指示是正确的。 2019-06-09
  • 人民日报发喜报庆祝我国第一颗氢弹爆炸成功 2019-05-30
  • 96次航拍峨眉 换个角度看巴蜀名山 中国国家地理网 2019-05-30
  • 陈秋冬:评估AI项目 我们需要思考三个问题 2019-05-03
  • 浙江:大学生就业实习平台启用 2019-05-03
  • 人民日报人民时评:个人信息,利用好更需保护好 2019-04-21
  • 山西临汾:壶口瀑布奔腾咆哮奇景 2019-04-21
  • 蔡徐坤粉丝破千万送福利 帅气运动装长腿吸睛 2019-04-17
  • 吉林时时彩中奖规则表 新疆福彩18选7 精准五肖公式规律 海南飞鱼有直播吗 福彩福建时时彩走势图 电子游戏是什么 爱彩乐专业版下载 青海快三走势图今天 唐山彩票中心 大乐透127期历史图表 6场半全场对阵表 六肖中特期期准免费期 天津11选5开奖走势 通天报波叔一波中特 西藏生肖时时彩开奖

    当前文章://www.rl-f1.com/home/har7h5n05y.html

    发布时间:2019-07-22 04:04:59

    【关注】土豆种植要注意哪些问题? 九江漫天飞絮到底来自哪里?15号-25号不能晒被子?权威部门这样解答 中国教育的痛点在哪里 食用玫瑰花苗哪里有卖?要物美价廉的 适应内蒙气候生长牧草有哪些? 室外常见花卉种子有哪些? 河北哪里有批发燕麦种子的? 巨紫荆种子价格哪里最低?

    《凤凰进农家》:第二十一章刘家的哪些龌龊事 TVB96版《笑傲江湖》中『锾攘睫代的任盈盈』如今靠助行架颇膣生活?哪有呃??? 飞燕草种子价格哪家最低? 求购臭椿种子去哪里? 63岁刘晓庆简单装束亮相活动,满脸油光,脸部僵硬!这脸是怎么了 《无敌小农民》:7783 第111章 凭什么给钱?.zip 长斑了该怎么办 【转载】辞职之前你真的想清楚了吗? 腊梅是常绿树吗?

    编辑:文卓伯纯

      文章推荐

      分类排行榜

      专栏文章

      更多>

      服务推荐

      上海天天彩4开奖结果
      蓖麻树结种子吗? 扫一扫关注最新创业资讯