Stage1st

 找回密码
 立即注册
搜索
楼主: 星之卡比
打印 上一主题 下一主题

[科技] 阿里云内部全面推行AI写代码

[复制链接]
     
81#
发表于 2024-4-2 17:45 来自手机 | 只看该作者
所以啥都不懂的人什么时候可以用这种工具做点什么水平的东西出来?虽然我也没有创意能做就是了

—— 来自 vivo V2243A, Android 14上的 S1Next-鹅版 v2.1.2
回复

使用道具 举报

     
82#
发表于 2024-4-2 18:01 来自手机 | 只看该作者
对于通用,重复的东西,AI的效率提升挺大的。以后程序猿就叫软件工程师吧。

—— 来自 Xiaomi 24031PN0DC, Android 14上的 S1Next-鹅版 v2.5.4
回复

使用道具 举报

     
83#
发表于 2024-4-2 18:39 | 只看该作者
可能是我还不会用AI吧,我感觉他还是大事干不了小事干不好
往大了说,我的电商网站需要做搜索系统,请给我生成一个基于LTR模型的、有粗排精排算法、用户画像千人千面的搜索系统,包括里面用到的各种框架、技术选型、软件、架构、集群配置相关的代码和资料,双击一键运行,他能弄出来吗?还不是得我自己去研究架构?
往小了说,我有个业务逻辑,用户这样操作的时候需要生成这样的数据,需要预热这样的缓存以便减少后续的sql查询,需要给用户这样的反馈,如果出错了需要这样处理,等我写完prompt可能写的文字跟我写代码一样长了

感觉就让他写个正则处理之类的功能函数好使

回复

使用道具 举报

     
84#
发表于 2024-4-2 18:41 来自手机 | 只看该作者
这下资本家没卖吊死自己的绳子,码工却写出了吊死自己的程序了
回复

使用道具 举报

     
85#
发表于 2024-4-2 18:50 来自手机 | 只看该作者
不是说瞧不起写代码的ai,主要是看不上这个通义灵码
之前用这玩意查api的时候都给我硬造了几个不存在的接口,之后就没用了
直接用来写代码不知道会变成啥样
回复

使用道具 举报

     
86#
发表于 2024-4-2 19:01 | 只看该作者
咋轮到码农就没有好死早该死死了
回复

使用道具 举报

     
87#
发表于 2024-4-2 19:16 来自手机 | 只看该作者
ycjiang1337 发表于 2024-4-2 11:49
我司现在快把国内外主流的大模型都收集齐了,现在用内网大模型聊天写pandas和pyspark的口水代码,效率极高 ...

同感,GLM绝对是当前国内一流的AI团队。
回复

使用道具 举报

     
88#
发表于 2024-4-2 19:18 来自手机 | 只看该作者
mimighost 发表于 2024-4-2 16:01
米国的大科技早就推开了

现在还有不用chatgpt的程序员?chatgpt比这些专门的代码工具有用多了 ...

扯,一看就是不实际用AI的,起码在国内现实情景下,gpt4大部分情况不是第一选择,甚至不是第一梯队选择。
回复

使用道具 举报

     
89#
发表于 2024-4-2 19:28 | 只看该作者
gpt4还是挺好用的,阿里内网gpt4-128k也能随便玩,只不过copilot是不能用的,而且不能把公司代码贴上去。不过平时一些分析日志小脚本,正则,输入输出非常明确的小功能用gpt4写还是挺爽的,起码不用去翻文档了
回复

使用道具 举报

     
90#
发表于 2024-4-2 19:39 | 只看该作者
用ai写那些熟透了的框架简直神奇,比如qtwidget
回复

使用道具 举报

     
91#
发表于 2024-4-2 20:22 | 只看该作者
每次说到AI生成代码就是吊死程序员。。。
请问frontpage吊死了多少程序员  intellij idea、visual studio吊死了多少程序员?
现阶段AI能做的事和这些东西有本质差别么
回复

使用道具 举报

     
92#
发表于 2024-4-2 21:07 来自手机 | 只看该作者
说到Ai编程总是说到前端后端,比较好奇目前有能优化sql的ai不

—— 来自 vivo V2329A, Android 14上的 S1Next-鹅版 v2.5.4
回复

使用道具 举报

     
93#
发表于 2024-4-2 21:23 | 只看该作者
kemyes 发表于 2024-4-2 21:07
说到Ai编程总是说到前端后端,比较好奇目前有能优化sql的ai不

—— 来自 vivo V2329A, Android 14 ...

有吧, 之前用百度的api时看到过百度提供的prompt模版

  1. 现在你是一名[SQL]大师,请理解我的代码并给出对应的优化建议及示例。我给出的代码是:[SELECT dt,
  2.           imei
  3.    FROM
  4.      (SELECT a.dt,
  5.              a.imei,
  6.              FIRST_VALUE(a.timestamp) OVER(PARTITION BY a.imei,a.dt
  7.                                          ORDER BY TIMESTAMP ASC) first_time ,
  8.                                                                  a.timestamp ,
  9.                                                                  actiontype
  10.       FROM hdp_lbg_zz_zplisting.ods_wb_tb_app_action a
  11.       WHERE a.dt between `${date1}`  and `${date2}`
  12.       AND  from_unixtime(cast(TIMESTAMP/1000 AS int),`yyyyMMdd`)=a.dt
  13. ]
复制代码
  1. 这段SQL代码在查询一个名为`hdp_lbg_zz_zplisting.ods_wb_tb_app_action`的表,该表包含字段`dt`,`imei`,`timestamp`和`actiontype`。查询的目标是在特定的日期范围(`${date1}`和`${date2}`之间)内,按照`imei`和`dt`进行分组,并按照时间戳(`timestamp`)的升序进行排序。对于每个分组,它选择第一个时间戳作为`first_time`。

  2.       一些可能的优化建议:

  3.       1. **窗口函数的优化**:这个查询使用了窗口函数`FIRST_VALUE()`来获取每个分组(根据imei和dt)的时间戳的第一个值。这是一个相对昂贵的操作,特别是在数据集大的情况下。一个可能的优化是直接使用排序(ORDER BY)来代替窗口函数。这可以通过在外部查询中再次排序并选择第一个时间戳来实现。但是,这种方法的缺点是它需要更多的内存,因为它需要存储整个排序结果。
  4.       2. **数据类型的一致性**:在这个查询中,我们首先将`timestamp`字段除以1000,然后转换为Unix时间戳(整数形式),然后再转换为`yyyyMMdd`格式的日期。这一系列的转换可能会消耗一些计算资源,并可能导致精度损失。如果`timestamp`字段已经是以毫秒为单位的Unix时间戳,那么我们可以直接使用它,而不是进行这些转换。
  5.       3. **使用索引**:如果这个查询在生产环境中运行,那么使用索引可能会**提高查询性能。例如,如果查询主要根据`imei`和`dt`进行分组,那么在这两个字段上创建索引会有很大的帮助。

  6.       以下是一个可能的优化后的SQL代码示例:


  7.       ```sql
  8.       SELECT dt,
  9.              imei,
  10.              first_timestamp
  11.       FROM (
  12.         SELECT a.dt,
  13.                a.imei,
  14.                MIN(a.timestamp) OVER (PARTITION BY a.imei, a.dt) first_timestamp,
  15.                actiontype
  16.         FROM hdp_lbg_zz_zplisting.ods_wb_tb_app_action a
  17.         WHERE a.dt BETWEEN `${date1}` AND `${date2}`
  18.           AND a.timestamp >= UNIX_TIMESTAMP(DATE_FORMAT(`${date1}`, `yyyyMMdd`)) * 1000
  19.           AND a.timestamp <= UNIX_TIMESTAMP(DATE_FORMAT(`${date2}`, `yyyyMMdd`)) * 1000
  20.       ) AS x;
  21.       ```
  22.       这个查询在原始查询的基础上进行了以下修改:

  23.       * 移除了不必要的转换。现在我们假设`timestamp`是以毫秒为单位的Unix时间戳,所以我们只需要将它除以1000来得到以秒为单位的Unix时间戳。
  24.       * 使用了MIN()函数代替了FIRST_VALUE()函数来找到每个分组的第一个时间戳。这样做的好处是它不需要额外的内存和计算资源。
  25.       * 在外部查询中添加了过滤条件以减少需要处理的数据量。现在我们只处理在指定的日期范围内的数据。
复制代码


回复

使用道具 举报

     
94#
发表于 2024-4-2 21:33 来自手机 | 只看该作者
本帖最后由 gammatau 于 2024-4-2 21:43 编辑
pagedown 发表于 2024-4-2 11:36
之前泥潭的风向一直是程序员是最不可能被AI替代的职业,怎么一下子就变了。当然我知道普通程序员和顶尖的 ...

所谓代码,就是指导计算机干活的prompt。如果AI能替程序员写代码了,那就是给AI写prompt变成新的代码罢了。这种事在计算机科学史上已经品鉴过太多次了(

只是程序员工作量的及格线会飙升,就像以前装卸员肩膀扛一天装十吨,现在装卸员开铲车一天一千吨。
回复

使用道具 举报

     
95#
发表于 2024-4-2 21:40 | 只看该作者
AI可以自动化一些重复性高、标准化的编程任务,比如修复常见的BUG、编写标准代码模块等。
这样的话,程序员就可以将更多的精力用在比如架构设计、性能优化、用户体验提升等更为复杂的任务上。
回复

使用道具 举报

     
96#
发表于 2024-4-2 21:40 来自手机 | 只看该作者
有一说一,上海ai实验室和字节正在搞端到端的devbench,https://mp.weixin.qq.com/s/JdQKlq-0RHBlnccOA4ebZQ
希望这两年可以出个能刷到满分的开源模型,现在的模型水平还是太低了。

—— 来自 OPPO PFFM20, Android 14上的 S1Next-鹅版 v2.5.4
回复

使用道具 举报

     
97#
发表于 2024-4-2 21:43 | 只看该作者
tylm我也用,但说句实话,就一个new 然后无脑多线程的玩意  代码我一个刚入行的同事只能cv不会改造,我笑死,除了枚举词不达意,其他没卵用
回复

使用道具 举报

     
98#
发表于 2024-4-2 22:24 | 只看该作者
osborn 发表于 2024-4-2 18:39
可能是我还不会用AI吧,我感觉他还是大事干不了小事干不好
往大了说,我的电商网站需要做搜索系统,请给我 ...

拆分成小片的函数,他就有用了

还有就是nlp提取信息,分类之类的,比现存的好使多了
回复

使用道具 举报

     
99#
发表于 2024-4-2 22:27 | 只看该作者
奥古斯都 发表于 2024-4-2 15:11
没卵用.我更关心有没有好用的 AI code  explain.
多数开源项目为了性能牺牲了可读性,我都快疯了. ...

贴给GPT4可以吗
回复

使用道具 举报

     
100#
发表于 2024-4-2 22:30 | 只看该作者
kemyes 发表于 2024-4-2 21:07
说到Ai编程总是说到前端后端,比较好奇目前有能优化sql的ai不

—— 来自 vivo V2329A, Android 14 ...

sql感觉是冲击最大的了,sql的语料用法充足,实践中绝大多数情况就是数据集合操作,不会出现那种冷门语言冷门库乱编用法和api的情况。
回复

使用道具 举报

     
101#
发表于 2024-4-2 22:39 | 只看该作者
别的公司还好说,阿里的通义灵码写代码什么水平自己没点逼数吗
回复

使用道具 举报

     
102#
发表于 2024-4-2 22:43 来自手机 | 只看该作者
本帖最后由 MedCoter 于 2024-4-2 22:45 编辑

这AI既给员工提供代码,又拿员工写的代码训练,工作效率上去了,员工的工作量也就跟着上去了
回复

使用道具 举报

     
103#
发表于 2024-4-2 22:49 | 只看该作者
本帖最后由 诚司 于 2024-4-2 22:55 编辑
奥古斯都 发表于 2024-4-2 15:11
没卵用.我更关心有没有好用的 AI code  explain.
多数开源项目为了性能牺牲了可读性,我都快疯了. ...

我现在就干的差不多是这个,函数级的完全没问题,别说开源代码,ida反编译的都没问题,文心一言,gpt3.5,通义千问都可以

但是你要项目级的,直接把整个项目输进去,逻辑复杂点的话一般是不行的,如果他输出一个极长的代码注释级别的,那没用,还不如看代码,如果你让模型输出一小段话来总结项目,他也可能会输出虽然正确但没用的废话,比如,代码功能是一个加载动态链接库的一些函数,然后用动态链接的函数来发送数据。他可能输出“该函数调用了操作系统的一个功能(但不说什么功能),调用了一个动态链接库(但不提名字),然后调用里面的函数,然后返回值是xxx”。并且在prompt里强调你要关注xxx方面的重点也没用,大文档处理的情况指令遵从能力有问题的。

我基本经验是:1.写代码的大模型读代码能力未必强,因为指令遵循能力有问题,比如codellama 70B,安全控制很严格,而且指令遵循能力很差,deepseekcoder略好。而这俩都不如qwen 1.5和dbrx这种通用模型。同理,通义灵码读代码未必比通义千问强。不过dbrx,chatgpt,gpt4都是六边形战士模型,能力应该都很强
2. 读项目级代码这种工作,至少现在,不是一个大模型任务而是一个大模型应用任务,应该是一个项目结构解析器、链接器,再加一堆大模型组成的agent,上下文再长也不大可能直接喂进去就解释出来,就算解释的很对也不一定是人需要的
回复

使用道具 举报

     
104#
发表于 2024-4-2 22:53 | 只看该作者
通义灵码应该是用过的最屎的AI补全了。。
回复

使用道具 举报

     
105#
发表于 2024-4-2 23:07 | 只看该作者
百响 发表于 2024-4-2 22:30
sql感觉是冲击最大的了,sql的语料用法充足,实践中绝大多数情况就是数据集合操作,不会出现那种冷门语言 ...

text2sql 是一回事,优化 SQL 是另一回事
回复

使用道具 举报

     
106#
发表于 2024-4-2 23:18 | 只看该作者
御坂MKII 发表于 2024-4-2 23:07
text2sql 是一回事,优化 SQL 是另一回事

确实,用提示来优化代码,大部分情况下优化不出个所以然来,逻辑还是差了点。
回复

使用道具 举报

     
107#
发表于 2024-4-2 23:22 | 只看该作者
本帖最后由 御坂MKII 于 2024-4-2 23:30 编辑
kemyes 发表于 2024-4-2 21:07
说到Ai编程总是说到前端后端,比较好奇目前有能优化sql的ai不

—— 来自 vivo V2329A, Android 14 ...

现在基于一些规则给 SQL 做些简单的改写或者索引建议这种目前相对好做了,我司就在堆相关的功能。而且甚至都不需要 llm,单靠规则就可以,这个时候 llm 更多的就是作为自然语言转结构化语言的接口。我测过一个 rule based 的 sql 优化建议的 paper 作者实现的 demo,那个效果就很不错了。

但是复杂优化目前不是很好搞,复杂的情况就需要得到更详细的数据分布或者更准的行数估算,这个就是另一个非常麻烦的问题了
不过如果是要 GA 给人用的话,我们目前会做到给客户用的也只会做索引建议和 text2sql ,正确率够高,不会给用户肉眼无法辨别的错误反馈
回复

使用道具 举报

     
108#
发表于 2024-4-2 23:25 | 只看该作者
没用过阿里的,就说我们公司自研(基于llama)的代码辅助工具只能说写几行还行但要命的是领导要求我们冲击生成代码率占总代码的百分之30结果就是我们闲着没事的时候瞎生成一串代码然后删掉,哄领导开心
回复

使用道具 举报

     
109#
发表于 2024-4-3 00:59 来自手机 | 只看该作者
Realplayer 发表于 2024-4-2 14:14
问下ai能理解i++和++i之中的微言大义吗?如果对ai没区别,是不是说明码农就是矫情 ...

不理解这和码农就是矫情的关联是什么,能解释下吗

—— 来自 Lenovo TB-J716F, Android 13上的 S1Next-鹅版 v2.1.2
回复

使用道具 举报

     
110#
发表于 2024-4-3 01:18 来自手机 | 只看该作者
ai起花名吗
回复

使用道具 举报

     
111#
发表于 2024-4-3 01:20 | 只看该作者
ai起名还是不错的,最费脑的工作之一。
回复

使用道具 举报

     
112#
发表于 2024-4-3 01:30 | 只看该作者
最后定位问题要花去更多的时间和人,放在某些边缘系统还行
回复

使用道具 举报

     
113#
发表于 2024-4-3 01:32 | 只看该作者
Realplayer 发表于 2024-4-2 14:14
问下ai能理解i++和++i之中的微言大义吗?如果对ai没区别,是不是说明码农就是矫情 ...

现在的生成式AI原理就不是理解
回复

使用道具 举报

     
114#
发表于 2024-4-3 09:04 | 只看该作者
御坂MKII 发表于 2024-4-2 23:22
现在基于一些规则给 SQL 做些简单的改写或者索引建议这种目前相对好做了,我司就在堆相关的功能。 ...

就是想看看大数据且业务复杂的场景目前AI能处理不,看起来还是不行。
回复

使用道具 举报

     
115#
发表于 2024-4-3 09:42 | 只看该作者
天王寺綯 发表于 2024-4-2 18:41
这下资本家没卖吊死自己的绳子,码工却写出了吊死自己的程序了

资本家一直再卖,主要无产阶级不好意思动手。唯一动手的那一次,几乎被骂成和焚书坑儒可以齐名了。

但是资本家对无产阶级动手的时候,从来不会不好意思。
回复

使用道具 举报

116#
发表于 2024-4-3 10:37 | 只看该作者
idea集成copilot以后非常好用。离不开了
回复

使用道具 举报

     
117#
发表于 2024-4-3 10:45 | 只看该作者
用codegeex自动补全已经很久了,很省力
回复

使用道具 举报

头像被屏蔽
     
118#
发表于 2024-4-3 11:26 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
119#
发表于 2024-4-3 11:34 | 只看该作者
我觉得以后IDE会集成AI
回复

使用道具 举报

     
120#
发表于 2024-4-3 11:36 来自手机 | 只看该作者
moekyo 发表于 2024-4-3 11:26
我去找了楼里提到的codegeex,为毛官网打开,点击下载插件没有反应呢

我用 Waterfox 也点不开,懒得排查是哪个插件妨碍,换 Edge 就好了

评分

参与人数 1战斗力 +1 收起 理由
moekyo + 1 好评加鹅

查看全部评分

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|Archiver|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|stage1st 沪ICP备13020230号-1 沪公网安备 31010702007642号

GMT+8, 2024-5-1 19:15 , Processed in 0.047976 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表