摘要
看过我前一篇文章的大概知道,我懂点数码,上一次写文章是因为AI帮助我翻译了一本书,那已经是2023年的事情了,AI发展了3年,中间有两年我去做硬件生态的工作,机缘巧合下还研究上了Embodied AI,结识了一堆做具身智能的大佬,甚至还是某云发布会上上所有具身智能伙伴的连接点,但那两年是看得多做得少,用的也很表面,只是把它当作对话框在使用。去年差不多是这个时间点,做了一份洞察报告,结合各行业技术应用的案例,我认为具身智能举例商业落地还尚远,但LLM+AI Agent 的应用已经就在眼前了,当时Haivivi和AI玩具也正在风口之上,找个机会遍开始从事AI2C的创业。巧得很,当时如果不在国内搞这个,就去中东搞出海,此时此刻回想皆有可能是命运的安排。创业嘛,需要我干啥就干啥,充当项目经理从0到1做了一款AI硬件产品出来,这期间团队完全拥抱AI,我个人用的更多的还是对话流式的AI。从 Apple Watch 录音是m4a格式,国内的豆包、元宝当时都不支持网页对话框传上去语音转文字,只有通过iPhone 分享给豆包语音转文字来做会议纪要,到后来发现Gemini 网页端支持m4a格式,开始频繁使用Gemini和豆包等做对比,最终发现还是Gemini牛逼,便一直使用至今。我也用了朋友公司集合式的AI对话工具,里面支持很多大模型,有段时间也很中意 Grok,但最终还是被Gemini俘获走了。讲实话,我第一次尝试用AI做对话外的事情是做workflow,当时比较火的就是Dify和扣子了,刚好同事安装好了本地的Dify,还在本地部署了一些千问的模型,于是就用Dify来做workflow。创业公司必须要经历的就是招人,当时我们要招各个岗位的人,很多人完全在我们的认知之外,比如AI算法工程师、硬件工程师、嵌入式工程师,我们跟HR沟通JD就够费劲的了,还要面试,简直了。当时我就想到了一套AI面试工作流,当时一是没想到别人肯定做了,而是也不知道Dify可以直接复用别人的工作流,于是就自己从头开始做,好在确实不难,遇到了一些不是问题的问题,当时脑子真的不知道咋就没想到遇到问题截图问AI助手就好了,现在回想起来真是太蠢了。不过我做的面试工作流前面差强人意,在用了几次后不断去调整系统里的Prompt是有变得越来越好用,只可惜当时集团的网络和我们部门网络的问题,没有让这个流程继续优化下去,基本上是我
摘要可能不完整,可查看原文
相关事件
暂无数据
相关人物
暂无数据