阿里云内部全面推行AI写代码

Headless · 发表于 2024-4-2 17:45

所以啥都不懂的人什么时候可以用这种工具做点什么水平的东西出来？虽然我也没有创意能做就是了

—— 来自 vivo V2243A, Android 14上的 S1Next-鹅版 v2.1.2

statespace · 发表于 2024-4-2 18:01

对于通用，重复的东西，AI的效率提升挺大的。以后程序猿就叫软件工程师吧。

—— 来自 Xiaomi 24031PN0DC, Android 14上的 S1Next-鹅版 v2.5.4

osborn · 发表于 2024-4-2 18:39

提示: 作者被禁止或删除内容自动屏蔽

天王寺綯 · 发表于 2024-4-2 18:41

这下资本家没卖吊死自己的绳子，码工却写出了吊死自己的程序了

twit · 发表于 2024-4-2 18:50

不是说瞧不起写代码的ai，主要是看不上这个通义灵码
之前用这玩意查api的时候都给我硬造了几个不存在的接口，之后就没用了
直接用来写代码不知道会变成啥样

8HIT · 发表于 2024-4-2 19:01

咋轮到码农就没有好死早该死死了

lzchen · 发表于 2024-4-2 19:16

ycjiang1337 发表于 2024-4-2 11:49
我司现在快把国内外主流的大模型都收集齐了，现在用内网大模型聊天写pandas和pyspark的口水代码，效率极高 ...

同感，GLM绝对是当前国内一流的AI团队。

lzchen · 发表于 2024-4-2 19:18

mimighost 发表于 2024-4-2 16:01
米国的大科技早就推开了

现在还有不用chatgpt的程序员？chatgpt比这些专门的代码工具有用多了 ...

扯，一看就是不实际用AI的，起码在国内现实情景下，gpt4大部分情况不是第一选择，甚至不是第一梯队选择。

s1234y · 发表于 2024-4-2 19:28

gpt4还是挺好用的，阿里内网gpt4-128k也能随便玩，只不过copilot是不能用的，而且不能把公司代码贴上去。不过平时一些分析日志小脚本，正则，输入输出非常明确的小功能用gpt4写还是挺爽的，起码不用去翻文档了

laotoutou · 发表于 2024-4-2 19:39

提示: 作者被禁止或删除内容自动屏蔽

紧那罗 · 发表于 2024-4-2 20:22

每次说到AI生成代码就是吊死程序员。。。
请问frontpage吊死了多少程序员 intellij idea、visual studio吊死了多少程序员？
现阶段AI能做的事和这些东西有本质差别么

kemyes · 发表于 2024-4-2 21:07

提示: 作者被禁止或删除内容自动屏蔽

天地一机成化育 · 发表于 2024-4-2 21:23

kemyes 发表于 2024-4-2 21:07
说到Ai编程总是说到前端后端，比较好奇目前有能优化sql的ai不

—— 来自 vivo V2329A, Android 14 ...

有吧, 之前用百度的api时看到过百度提供的prompt模版

现在你是一名[SQL]大师，请理解我的代码并给出对应的优化建议及示例。我给出的代码是：[SELECT dt,
imei
FROM
(SELECT a.dt,
a.imei,
FIRST_VALUE(a.timestamp) OVER(PARTITION BY a.imei,a.dt
ORDER BY TIMESTAMP ASC) first_time ,
a.timestamp ,
actiontype
FROM hdp_lbg_zz_zplisting.ods_wb_tb_app_action a
WHERE a.dt between `${date1}` and `${date2}`
AND from_unixtime(cast(TIMESTAMP/1000 AS int),`yyyyMMdd`)=a.dt
]

复制代码

这段SQL代码在查询一个名为`hdp_lbg_zz_zplisting.ods_wb_tb_app_action`的表，该表包含字段`dt`，`imei`，`timestamp`和`actiontype`。查询的目标是在特定的日期范围(`${date1}`和`${date2}`之间)内，按照`imei`和`dt`进行分组，并按照时间戳（`timestamp`）的升序进行排序。对于每个分组，它选择第一个时间戳作为`first_time`。
一些可能的优化建议：
1. **窗口函数的优化**：这个查询使用了窗口函数`FIRST_VALUE()`来获取每个分组（根据imei和dt）的时间戳的第一个值。这是一个相对昂贵的操作，特别是在数据集大的情况下。一个可能的优化是直接使用排序（ORDER BY）来代替窗口函数。这可以通过在外部查询中再次排序并选择第一个时间戳来实现。但是，这种方法的缺点是它需要更多的内存，因为它需要存储整个排序结果。
2. **数据类型的一致性**：在这个查询中，我们首先将`timestamp`字段除以1000，然后转换为Unix时间戳（整数形式），然后再转换为`yyyyMMdd`格式的日期。这一系列的转换可能会消耗一些计算资源，并可能导致精度损失。如果`timestamp`字段已经是以毫秒为单位的Unix时间戳，那么我们可以直接使用它，而不是进行这些转换。
3. **使用索引**：如果这个查询在生产环境中运行，那么使用索引可能会**提高查询性能。例如，如果查询主要根据`imei`和`dt`进行分组，那么在这两个字段上创建索引会有很大的帮助。
以下是一个可能的优化后的SQL代码示例：
```sql
SELECT dt,
imei,
first_timestamp
FROM (
SELECT a.dt,
a.imei,
MIN(a.timestamp) OVER (PARTITION BY a.imei, a.dt) first_timestamp,
actiontype
FROM hdp_lbg_zz_zplisting.ods_wb_tb_app_action a
WHERE a.dt BETWEEN `${date1}` AND `${date2}`
AND a.timestamp >= UNIX_TIMESTAMP(DATE_FORMAT(`${date1}`, `yyyyMMdd`)) * 1000
AND a.timestamp <= UNIX_TIMESTAMP(DATE_FORMAT(`${date2}`, `yyyyMMdd`)) * 1000
) AS x;
```
这个查询在原始查询的基础上进行了以下修改：
* 移除了不必要的转换。现在我们假设`timestamp`是以毫秒为单位的Unix时间戳，所以我们只需要将它除以1000来得到以秒为单位的Unix时间戳。
* 使用了MIN()函数代替了FIRST_VALUE()函数来找到每个分组的第一个时间戳。这样做的好处是它不需要额外的内存和计算资源。
* 在外部查询中添加了过滤条件以减少需要处理的数据量。现在我们只处理在指定的日期范围内的数据。

复制代码

gammatau · 发表于 2024-4-2 21:33

本帖最后由 gammatau 于 2024-4-2 21:43 编辑

pagedown 发表于 2024-4-2 11:36
之前泥潭的风向一直是程序员是最不可能被AI替代的职业，怎么一下子就变了。当然我知道普通程序员和顶尖的 ...

所谓代码，就是指导计算机干活的prompt。如果AI能替程序员写代码了，那就是给AI写prompt变成新的代码罢了。这种事在计算机科学史上已经品鉴过太多次了（

只是程序员工作量的及格线会飙升，就像以前装卸员肩膀扛一天装十吨，现在装卸员开铲车一天一千吨。

碧琟 · 发表于 2024-4-2 21:40

AI可以自动化一些重复性高、标准化的编程任务，比如修复常见的BUG、编写标准代码模块等。
这样的话，程序员就可以将更多的精力用在比如架构设计、性能优化、用户体验提升等更为复杂的任务上。

simpleyan · 发表于 2024-4-2 21:40

提示: 作者被禁止或删除内容自动屏蔽

Misono_Mayu · 发表于 2024-4-2 21:43

tylm我也用，但说句实话，就一个new 然后无脑多线程的玩意代码我一个刚入行的同事只能cv不会改造，我笑死，除了枚举词不达意，其他没卵用

カドモン · 发表于 2024-4-2 22:24

osborn 发表于 2024-4-2 18:39
可能是我还不会用AI吧，我感觉他还是大事干不了小事干不好
往大了说，我的电商网站需要做搜索系统，请给我 ...

拆分成小片的函数，他就有用了

还有就是nlp提取信息，分类之类的，比现存的好使多了

拜拜 · 发表于 2024-4-2 22:27

奥古斯都发表于 2024-4-2 15:11
没卵用.我更关心有没有好用的 AI code explain.
多数开源项目为了性能牺牲了可读性,我都快疯了. ...

贴给GPT4可以吗

百响 · 发表于 2024-4-2 22:30

kemyes 发表于 2024-4-2 21:07
说到Ai编程总是说到前端后端，比较好奇目前有能优化sql的ai不

—— 来自 vivo V2329A, Android 14 ...

sql感觉是冲击最大的了，sql的语料用法充足，实践中绝大多数情况就是数据集合操作，不会出现那种冷门语言冷门库乱编用法和api的情况。

aki1ostt · 发表于 2024-4-2 22:39

别的公司还好说，阿里的通义灵码写代码什么水平自己没点逼数吗

MedCoter · 发表于 2024-4-2 22:43

本帖最后由 MedCoter 于 2024-4-2 22:45 编辑

这AI既给员工提供代码，又拿员工写的代码训练，工作效率上去了，员工的工作量也就跟着上去了

诚司 · 发表于 2024-4-2 22:49

提示: 作者被禁止或删除内容自动屏蔽

阿涛叔 · 发表于 2024-4-2 22:53

通义灵码应该是用过的最屎的AI补全了。。

御坂MKII · 发表于 2024-4-2 23:07

百响发表于 2024-4-2 22:30
sql感觉是冲击最大的了，sql的语料用法充足，实践中绝大多数情况就是数据集合操作，不会出现那种冷门语言 ...

text2sql 是一回事，优化 SQL 是另一回事

百响 · 发表于 2024-4-2 23:18

御坂MKII 发表于 2024-4-2 23:07
text2sql 是一回事，优化 SQL 是另一回事

确实，用提示来优化代码，大部分情况下优化不出个所以然来，逻辑还是差了点。

御坂MKII · 发表于 2024-4-2 23:22

本帖最后由御坂MKII 于 2024-4-2 23:30 编辑

kemyes 发表于 2024-4-2 21:07
说到Ai编程总是说到前端后端，比较好奇目前有能优化sql的ai不

—— 来自 vivo V2329A, Android 14 ...

现在基于一些规则给 SQL 做些简单的改写或者索引建议这种目前相对好做了，我司就在堆相关的功能。而且甚至都不需要 llm，单靠规则就可以，这个时候 llm 更多的就是作为自然语言转结构化语言的接口。我测过一个 rule based 的 sql 优化建议的 paper 作者实现的 demo，那个效果就很不错了。

但是复杂优化目前不是很好搞，复杂的情况就需要得到更详细的数据分布或者更准的行数估算，这个就是另一个非常麻烦的问题了

。
不过如果是要 GA 给人用的话，我们目前会做到给客户用的也只会做索引建议和 text2sql

，正确率够高，不会给用户肉眼无法辨别的错误反馈

casualice · 发表于 2024-4-2 23:25

没用过阿里的，就说我们公司自研（基于llama）的代码辅助工具只能说写几行还行

但要命的是领导要求我们冲击生成代码率占总代码的百分之30

结果就是我们闲着没事的时候瞎生成一串代码然后删掉，哄领导开心

Cypher_96 · 发表于 2024-4-3 00:59

Realplayer 发表于 2024-4-2 14:14
问下ai能理解i++和++i之中的微言大义吗？如果对ai没区别，是不是说明码农就是矫情 ...

不理解这和码农就是矫情的关联是什么，能解释下吗

—— 来自 Lenovo TB-J716F, Android 13上的 S1Next-鹅版 v2.1.2

是挞不是派 · 发表于 2024-4-3 01:18

ai起花名吗

百响 · 发表于 2024-4-3 01:20

ai起名还是不错的，最费脑的工作之一。

不能放过孩子 · 发表于 2024-4-3 01:30

最后定位问题要花去更多的时间和人，放在某些边缘系统还行

不能放过孩子 · 发表于 2024-4-3 01:32

Realplayer 发表于 2024-4-2 14:14
问下ai能理解i++和++i之中的微言大义吗？如果对ai没区别，是不是说明码农就是矫情 ...

现在的生成式AI原理就不是理解

kemyes · 发表于 2024-4-3 09:04

提示: 作者被禁止或删除内容自动屏蔽

化境 · 发表于 2024-4-3 09:42

天王寺綯发表于 2024-4-2 18:41
这下资本家没卖吊死自己的绳子，码工却写出了吊死自己的程序了

资本家一直再卖，主要无产阶级不好意思动手。唯一动手的那一次，几乎被骂成和焚书坑儒可以齐名了。

但是资本家对无产阶级动手的时候，从来不会不好意思。

gawain · 发表于 2024-4-3 10:37

idea集成copilot以后非常好用。离不开了

DFM_otto · 发表于 2024-4-3 10:45

用codegeex自动补全已经很久了，很省力

moekyo · 发表于 2024-4-3 11:26

我去找了楼里提到的codegeex，为毛官网打开，点击下载插件没有反应呢

clc-feng · 发表于 2024-4-3 11:34

我觉得以后IDE会集成AI

买码！注册！ · 发表于 2024-4-3 11:36

moekyo 发表于 2024-4-3 11:26
我去找了楼里提到的codegeex，为毛官网打开，点击下载插件没有反应呢

我用 Waterfox 也点不开，懒得排查是哪个插件妨碍，换 Edge 就好了

		自动登录	找回密码
密码			立即注册

[科技] 阿里云内部全面推行AI写代码

评分

osborn osborn 当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2009-9-17 头像被屏蔽	发表于 2024-4-2 18:39 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

laotoutou laotoutou 当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2016-11-9 头像被屏蔽	发表于 2024-4-2 19:39 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

kemyes kemyes 当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2007-8-19 头像被屏蔽	发表于 2024-4-2 21:07 来自手机 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

simpleyan simpleyan 当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2012-10-13 头像被屏蔽	发表于 2024-4-2 21:40 来自手机 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

诚司诚司当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2014-11-27 头像被屏蔽	发表于 2024-4-2 22:49 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

kemyes kemyes 当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2007-8-19 头像被屏蔽	发表于 2024-4-3 09:04 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报