大模型编排平台dify初上手

AlphaGo赢了李世石,chatgpt惊艳了世人,L2级别自动驾驶已遍地跑,萝卜的L4已开始逐步落地,大模型也逐渐上车了。近几年大模型劲头十足,大有把一切推倒、再重塑的势头。随着全世界从移动互联网阶段进人工智能阶段,芯片、算力开始成为新时代的基石。

工作和生活中,虽然一直在使用chatgpt、deepseek等平台,但一直没有静下心来深入学习一下。近日接触到一款开源的大模型平台dify,简单用它编排了几个调用大模型的流程,非常好用,大大降低了非专业人士使用大模型开发应用的难度,在此简单做个记录。

dify是由一家位于中国苏州的创业公司苏州语灵人工智能科技有限公司推出的大语言模型应用开发平台,它提供了非常多插件和脚手架,几分钟内就可以基于大语言模型开发出一套自己的业务流程。

几个概念

开始之前,需要了解几个概念

  1. 工作流,与程序开发中的工作类类似,是一串节点的集合,用来串行的处理数据,最终得到结果。
  2. 节点,一个原子操作,节点中可以定义如何处理数据,节点有多种类型,有获取数据源的、有处理数据的、有从库里读取数据的,还能自己编程自定义节点处理逻辑,等等;多个节点联起来,就构成了工作流。
  3. 变量,就是编程领域中的参数的意思;有系统变量、有用户变量,变量可以在工作流的节点中传递。
  4. LLM,即Large Language Model(大模型),是指各大公司推出的已经训练好大模型产品,如deepseek、chatgpt4.0、gemini等,目前已经有非常多的产品了。大模型也有类型,有处理文本的、有处理语音的、有处理视频、图片的,等。

大模型Token

上面提到的各家大模型的产品,如deepseek、chatgpt,都是各大公司花费了巨资,购买了很多GPU、使用海量数据训练出来的,人家想对某些模型收个费,没问题吧。目前大多数大模型都是用Token数来计费,每次调用大模型进行推理运算,都需要消耗一定数量的Token数,根据任务的类型会消耗不同的数量(一般是从几百到几千甚至更多)。阿里的通义目前提供100万Token的试用,可以去申请,申请成功之后,拿到api-key,配置到dify平台即可。

简单配置一个图像识别的大模型工作流

在dify的工作台创建一个“工作流”类型的项目,然后就可以配置节点了,所有的工作流必有“开始”和“结束”节点。
如我创建的一个上传一张图片--->调用大模型来识别这张图片---->将大模型的输出结果翻译成中文,这个流程。
大模型流程

整个流程最核心的就是中间两部,调用大模型进行图片识别,然后将结果翻译成中文。
在开始节点中,仅仅是定义了一个文件变量,用来上传一张图片:
start node
在图片识别节点,最重要的是写提示词(prompt),这个提示词是用来对大模型下达任务的,在模型已经固定的情况下,提示词直接会影响结果的质量。
提示词

下面是我长传了一张小猫的图片,以及输出的结果
输入小猫照片

输出结果:
大模型输出结果
可能你会认为这种照片识别的功能,目前chatgpt、文心一言等平台都能轻松做到;但是再往深层想,大模型的能力已经沉淀到底层,成为新时代的基石,就如之前的水电煤一样;各种上层应用都可以轻松获取到大模型的能力,进而来完善自己平台的能力。

一些看法

  1. 基础科技的质变,会带动上层业务的巨变。比如5G技术,让直播、视频等大火;芯片算力的提升,让自动驾驶、大模型训练开始出现在人们面前。科技在进步,一切都在变化,唯一不变的就是变化。
  2. 每一次科技的巨变,都会引起整个行业的重塑,对之前的行业、从业者等都是一次巨大的冲击和考研。在技术领域,大公司如不能踩中发展的节拍,很可能就倒下了。
  3. 对人来说,基本不太可能一份工作从头做到尾了,因为20年时间,整个行业、整个技术、整个方向都可能发生巨变,之前从业者擅长的东西,可能瞬间就被抛弃了。
  4. 中国的互联网近20年高速发展,也产生了大量的技术人才,但是在面临智能化的时代,之前的技术研发掌握的显示编程的能力,会被弱化,逐渐会被算法、大模型挤占生存空间。
  5. 拿测试开发这个职业来说,之前20年里,追求的是测试自动化、测试工具开发、是对研发代码的掌握能力,是对业务每个分支、具体逻辑的掌握,一切都是明确的、可梳理的,是可复现的。但是智能化时代,一切都变成黑盒了,底层都是算法,是大规模数据训练出来的参数,人类已经无法再对大模型的产出进行严格的反向回溯了。
  6. 当然也不用太悲观,传统职业肯定会受到冲击,但是肯定不会消失。比如,即使算法时代,也得有人去为算法开发工具链、开发平台不是,也得有测试人员去测试算法、评测算法的输出不是。还是那句话,一切都在变化,打不过就加入;肯定也有人无法加入,那就只能另想办法了。
版权声明

本站文章、图片、视频等(除转载外),均采用知识共享署名 4.0 国际许可协议(CC BY-NC-SA 4.0),转载请注明出处、非商业性使用、并且以相同协议共享。

© 空空博客,本文链接:https://www.yeetrack.com/?p=1673