全球数字财富领导者
CoNET
|
客户端
|
旧版
|
北美站
|
FX168 全球视野 中文财经
首页
资讯
速递
行情
日历
数据
社区
视频
直播
点评旗舰店
商品
财富汇
登录 / 注册
搜 索
综合
行情
速递
日历
话题
168人气号
文章
CPT Markets:OPEC+减产疑虑及对需求担忧令油价四连阴!日内关注美国ADP就业及EIA数据
go
lg
...
在利空数据方面,美国能源部加大了补充
石
油
库存的力度,预计将在2月(而非夏季)回购400万桶
石
油
储备,显示出利用油价下跌的新紧迫性。沙特阿拉伯对自愿减产的欢迎态度及对减产的可控撤回也对市场产生影响。英国、欧洲、中东和非洲高级市场分析师Craig Erlam表示,OPEC+协议对支撑价格几乎没有作用,考虑到随后的四天下跌,交易员显然非常不以为然。尽管俄罗斯副总理 亚历山大·诺瓦克 表示,OPEC+随时准备在明年第一季度深化
石
油
减产,但油价仍然下跌。 OPEC+同意在明年第一季度自愿减产约220万桶/日,但其中至少130万桶/日的减产是沙特阿拉伯和俄罗斯自愿减产的延伸。 在美国方面,美国至12月1日当周API原油库存增加59.4万桶,这一数据导致油价在结算后扩大跌幅。美国原油库存意外增加,加剧了市场对上周主要产油国减产承诺弱于预期后全球原油供应可能过剩的担忧。此外,最新美国就业数据显示,10月职位空缺降至2021年初以来的最低水平,美元兑一篮子货币升至两周高位。劳动力市场放缓和通胀消退引发了市场的乐观情绪,认为美联储可能会在本周期加息,金融市场预计明年中期会降息。美元走强使得使用其他货币的买家更昂贵,从而减少了
石
油
的需求。 从上方压制(上方阻力) 77.00,77.50;从下行方向看,下方支撑76.70。 CPT Markets风险提示及免责条款 : 以上文章内容仅供参考,不作为未来投资建议。CPT Markets 发布的文章主要根据国际财经数据报告及国际新闻为参考依据。
lg
...
CPT_Markets
2023-12-06
宝丰能源上涨2.08%,报14.23元/股
go
lg
...
新材料行业领军企业,主要业务是以煤替代
石
油
生产高端化工产品和新能源替代化石能源,以实现国家能源安全和碳中和目标。公司在宁夏宁东国家级能源化工基地投资727亿元建设的现代煤化工产业集群年产能覆盖810万吨煤炭、700万吨焦炭、1460万吨洗煤、740万吨甲醇、346万吨烯烃、135万吨精细化工项目,同时在内蒙古鄂尔多斯地区投资673亿元规划建设年产500万吨烯烃项目。 截至9月30日,宝丰能源股东户数7.52万,人均流通股9.75万股。 2023年1月-9月,宝丰能源实现营业收入204.01亿元,同比减少5.05%;归属净利润38.91亿元,同比减少27.58%。
lg
...
金融界
2023-12-06
中南文化上涨5.36%,报2.36元/股
go
lg
...
员工近1300人,产品大量销售并应用于
石
油
、化工、海洋工程、船舶、建筑、燃气、核电等行业。 截至10月20日,中南文化股东户数4.32万,人均流通股5.51万股。 2023年1月-9月,中南文化实现营业收入5.44亿元,同比增长27.72%;归属净利润1.28亿元,同比增长78.16%。
lg
...
金融界
2023-12-06
晨光电缆上涨6.05%,报5.08元/股
go
lg
...
品广泛应用于国网、南网公司,电源市场、
石
油
化工、建筑和交通等行业。 截至9月30日,晨光电缆股东户数1.47万,人均流通股6006股。 2023年1月-9月,晨光电缆实现营业收入12.78亿元,同比减少5.30%;归属净利润4338.83万元,同比减少9.34%。
lg
...
金融界
2023-12-06
百利科技上涨5.06%,报8.52元/股
go
lg
...
值解决方案的技术服务提供商,主要服务于
石
油
天然气、
石
油
化工、现代煤化工和新能源材料行业。公司在40多年的运营中,完成了近4000项工程咨询、工程设计和工程总承包项目,拥有化工石化医药全行业、轻纺行业、建筑行业等多个行业的工程设计甲级、工程咨询甲级以及压力容器设计、压力管道设计等业务资质证书。 截至9月30日,百利科技股东户数2.08万,人均流通股2.36万股。 2023年1月-9月,百利科技实现营业收入14.88亿元,同比减少19.51%;归属净利润1431.98万元,同比减少86.31%。
lg
...
金融界
2023-12-06
丰元股份上涨5.12%,报16.44元/股
go
lg
...
材料产能达到14万吨,且已成功入围中国
石
油
和化工企业500强、山东省“十强”产业集群领军企业。 截至11月20日,丰元股份股东户数3.95万,人均流通股5460股。 2023年1月-9月,丰元股份实现营业收入23.21亿元,同比增长91.27%;归属净利润-1.5亿元,同比减少199.58%。
lg
...
金融界
2023-12-06
主次节奏:原油下行力度减缓,趋势不变
go
lg
...
上周 OPEC+ 会议结束后,WTI
石
油
价格接近 74 美元。随着美国与其他国家之间的利差扩大,美元上涨。一旦美国补充其战略储备,
石
油
可能会随着供应增加而下跌。 原油从日线图级别看,油价自10月下旬二次反弹未果持续回落,最终走势形成下行趋势。油价已经触及8月低点77.80一带,油价围绕低点呈次要震荡格局,形成旗形中继形态,油价已经小幅跌破旗形下沿,本周内确认且突破的有效性,若确立有效,油价中期走势第一目标72.40前低点。 原油短线(1H)走势反复性下落,油价在均线系统的压制下,反弹受阻继续下行创新低。亚洲早盘油价创新低后,弱势调整,空头仍占优势,预计日内原油保持顺势下行节奏不变。 今日:73.20做空,止损:74.75,目标71.20。 免责声明:观点分享,仅供参考,不构成投资建议。投资有风险,盈亏须自负。
lg
...
主次节奏
2023-12-06
美国原油出口量接近创纪录,加剧供应过剩担忧,油价连续5天下跌
go
lg
...
忧该供应量的增加将超过沙特与欧佩克+的
石
油
减产量。WTI原油跌至每桶72美元,此前四个交易日跌幅超过7%,并将创下自2月份以来的最长跌势。 另外还值得注意的是,沙特阿拉伯将其对亚洲的官方销售价格下调了自二月份以来的最大降幅,反映了
石
油
市场的疲软。
lg
...
金融界
2023-12-06
easyMarkets易信:2023年12月6日美元指数冲击104压力,黄金向下测试2010美元支撑
go
lg
...
:30 美国至12月1日当周EIA战略
石
油
储备库存 请确认您完全了解这些产品交易涉及的风险,不要投入超出您亏损承受能力的资金。本集团公司已通过旗下子公司获得塞浦路斯证券和交易委员会(已通过欧盟金融工具市场法规MiFID的认证)的执照(Easy Forex Trading Ltd- CySEC 执照号为079/07)以及澳大利亚证券和投资委员会(ASIC)的执照(easyMarkets Pty Ltd - AFS 执照号为246566)。 免费电话: 4001203050 微信:easyMarketsCS 官网:https://chn.easymarkets.com/syc/zh-hans/ 加入我们的Telegram 获取免费的交易信号 2023-12-06
lg
...
易信easyMarkets
2023-12-06
Footprint Analytics x Future3 Campus联合发布AI与Web3研究报告
go
lg
...
遇到的挑战 在 Web2 时代,数据如
石
油
的“储量”般珍贵,访问和获取大规模数据一直是极大的挑战。在 Web3 中,数据的开放性和共享性一下子让大家觉得“
石
油
到处都是”,使得 AI 模型能够更轻松地获取更多的训练数据,这对于提高模型性能和智能水平至关重要。但对 Web3 这个“新
石
油
” 的数据处理依然有很多问题待解决,主要有以下几个: 数据来源:链上数据“标准”繁杂分散,数据处理花费大量人工成本 处理链上数据时,需要反复执行耗时而劳动密集的索引过程,需要开发者和数据分析师花费大量时间和资源来适应不同链、不同项目之间的数据差异。链上数据行业缺乏统一的生产和处理标准,除了记录到区块链账本上的,events,logs,and traces 等都基本上是项目自己定义和生产(或生成)的,这导致非专业交易者很难辨别并找到最准确和可信的数据,增加了他们在链上交易和投资决策中的困难。比如,去中心化交易所 Uniswap 和 Pancakeswap 就有可能在数据处理方法和数据口径上存在差异,过程中的检查和统一口径等工序进一步加大了数据处理的复杂性。 数据更新:链上数据体量大且更新频率高,难以及时地处理成结构化数据 区块链是时刻变动的,数据更新以秒甚至毫秒级别计。数据的频繁产生和更新使其难以维持高质量的数据处理和及时的更新。因此,自动化的处理流程是十分重要的,这也是对于数据处理的成本和效率的一大挑战。Web3 数据行业仍处于初级阶段。随着新合约的层出不穷和迭代更新,数据缺乏标准、格式多样,进一步增加了数据处理的复杂性。 数据分析:链上数据的匿名属性,导致数据身份难以区分 链上数据通常不包含足够的信息来清晰识别每个地址的身份,这使得数据在与链下的经济、社会或法律动向难以联动。但是链上数据的动向与现实世界紧密相关,了解链上活动与现实世界中特定个体或实体的关联性对于特定的场景比如数据分析来说十分重要。 随着大语言模型(LLM)技术引发的生产力变更讨论,能否利用 AI 来解决这些挑战也成为 Web3 领域的一个焦点关注之一。 AI 与 Web3 数据碰撞产生的化学反应 3.1 传统 AI 与 LLM 的特征对比 在模型训练方面,传统 AI 模型通常规模较小,参数数量在数万到数百万之间,但为了确保输出结果的准确性,需要大量的人工标注数据。LLM 之所以如此强大,部分原因在于其使用了海量的语料拟合百亿、千亿级以上的参数,极大地提升了它对自然语言的理解能力,但这也意味着需要更多的数据来进行训练,训练成本相当高昂。 在能力范围和运行方式上,传统 AI 更适合特定领域的任务,能够提供相对精准和专业的答案。相比之下,LLM 更适合通用性任务,但容易产生幻觉问题,这意味着在一些情况下,它的回答可能不够精确或专业,甚至完全错误。因此,如果需要和客观,可信任,和可以追溯的结果,可能需要进行多次检查、多次训练或引入额外的纠错机制和框架。 图 6:传统 AI 与大模型语言模型 (LLM)的特征对比 3.1.1 传统 AI 在 Web3 数据领域的实践 传统 AI 已经在区块链数据行业展现了其重要性,为这一领域带来了更多创新和效率。例如,0xScope 团队采用 AI 技术,构建了基于图计算的群集分析算法,通过不同规则的权重分配来帮助准确识别用户之间的相关地址。这种深度学习算法的应用提高了地址群集的准确性,为数据分析提供了更精确的工具。Nansen 则将 AI 用于 NFT 价格预测,通过数据分析和自然语言处理技术,提供有关 NFT 市场趋势的见解。另一方面,Trusta Labs使用了基于资产图谱挖掘和用户行为序列分析的机器学习方法,以增强其女巫检测解决方案的可靠性和稳定性,有助于维护区块链网络生态的安全。另一方面,Trusta Labs 采用了图挖掘和用户行为分析的方法,以增强其女巫检测解决方案的可靠性和稳定性,有助于维护区块链网络的安全。Goplus 在其运营中利用传统人工智能来提高去中心化应用程序(dApps)的安全性和效率。他们收集和分析来自 dApp 的安全信息,提供快速风险警报,帮助降低这些平台的风险敞口。这包括通过评估开源状态和潜在恶意行为等因素来检测 dApp 主合同中的风险,以及收集详细的审计信息,包括审计公司凭证、审计时间和审计报告链接。Footprint Analytics 则使用 AI 生成生产结构化数据的代码,分析 NFT 交易 Wash trading 交易以及机器人账户筛选排查。 然而,传统 AI 拥有的信息有限,专注于使用预定的算法和规则执行预设任务,而 LLM 则通过大规模的自然语言数据学习,可以理解和生成自然语言,这使其更适合处理复杂且巨量的文本数据。 最近,随着 LLM 取得了显著进展,人们对 AI 与 Web3 数据的结合,也进行了一些新的思考与探索。 3.1.2 LLM 的优势 LLM 相对于传统人工智能具有以下优势: 可扩展性:LLM 支持大规模数据处理 LLM 在可扩展性方面表现出色,能够高效处理大量数据和用户互动。这使其非常适合处理需要大规模信息处理的任务,如文本分析或者大规模数据清洗。其高度的数据处理能力为区块链数据行业提供了强大的分析和应用潜力。 适应性:LLM 可学习适应多领域需求 LLM 具备卓越的适应性,可以为特定任务进行微调或嵌入行业或私有数据库,使其能够迅速学习和适应不同领域的细微差别。这一特性使 LLM 成为了解决多领域、多用途问题的理想选择,为区块链应用的多样性提供了更广泛的支持。 提高效率:LLM 自动化任务提高效率 LLM 的高效率为区块链数据行业带来了显著的便利。它能够自动化原本需要大量人工时间和资源的任务,从而提高生产力并降低成本。LLM 可以在几秒内生成大量文本、分析海量数据集,或执行多种重复性任务,从而减少了等待和处理时间,使区块链数据处理更加高效。 任务分解:可以生成某些工作的具体计划,把大的工作分成小步骤 LLM Agent 具备独特的能力,即可以生成某些工作的具体计划,将复杂任务分解为可管理的小步骤。这一特性对于处理大规模的区块链数据和执行复杂的数据分析任务非常有益。通过将大型工作分解成小任务,LLM 可以更好地管理数据处理流程,并输出高质量的分析。 这一能力对于执行复杂任务的 AI 系统至关重要,例如机器人自动化、项目管理和自然语言理解与生成,使其能够将高级任务目标转化为详细的行动路线,提高任务执行的效率和准确性。 可访问性和易用性:LLM 以自然语言提供用户友好互动 LLM 的可访问性使更多用户能够轻松与数据和系统进行互动,让这些互动更加用户友好。通过自然语言,LLM 使数据和系统更容易访问和交互,无需用户学习复杂的技术术语或特定命令,例如,SQL,R,Python 等来做数据获取和分析。这一特性拓宽了区块链应用的受众范围,让更多的人能够访问和使用 Web3 应用和服务,不论他们是否精通技术,从而促进了区块链数据行业的发展和普及。 3.2 LLM 与 Web3 数据的融合 图 7:区块链数据与 LLM 的融合 大型语言模型的培训需要依赖大规模数据,通过学习数据中的模式来建立模型。区块链数据中蕴含的交互和行为模式是 LLM 学习的燃料。数据量和质量也直接影响 LLM 模型的学习效果。 数据不仅仅是 LLM 的消耗品,LLM 还有助于生产数据,甚至可以提供反馈。例如,LLM 可以协助数据分析师在数据预处理方面做出贡献,如数据清洗和标注,或者生成结构化数据,清除数据中的噪声,凸显有效信息。 3.3 增强 LLM 的常用技术解决方案 ChatGPT 的出现,不仅向我们展示了 LLM 解决复杂问题的通用能力,同时也引发了全球范围的,对在通用能力上去叠加外部能力的探索。这里包括,通用能力的增强(包括上下文长度、复杂推理、数学、代码、多模态等)以及外部能力的扩充(处理非结构化数据、使用更复杂的工具、与物理世界的交互等)。如何将 crypto 领域的专有知识以及个人的个性化私有数据嫁接到大模型的通用能力上,是大模型在 crypto 垂直领域商业化落地的核心技术问题。 目前,大多数应用都集中在检索增强生成(RAG)上,比如提示工程和嵌入技术,已经存在的代理工具也大多都聚焦于提高 RAG 工作的效率和准确性。市场上主要的基于 LLM 技术的应用栈的参考架构有以下几种: Prompt Engineering 图 8:Prompt Engineering 当前,大多数从业者在构建应用时采用基础解决方案,即 Prompt Engineering。这一方法通过设计特定的 Prompt 来改变模型的输入,以满足特定应用的需求,是最方便快捷的做法。然而,基础的 Prompt Engineering 存在一些限制,如数据库更新不及时、内容冗杂、以及对输入上下文长度(In-Context Length)的支持和多轮问答的限制。 因此,行业内也在研究更先进的改进方案,包括嵌入(Embedding)和微调(Fine-tuning)。 嵌入(Embedding) 嵌入(Embedding)是一种广泛应用于人工智能领域的数据表示方法,能高效捕获对象的语义信息。通过将对象属性映射成向量形式,嵌入技术能够通过分析向量之间的相互关系,快速找到最有可能正确的答案。嵌入可以在 LLM 的基础上构建,以利用该模型在广泛语料上学到的丰富语言知识。通过嵌入技术将特定任务或领域的信息引入到预训练的大模型中,使得模型更专业化,更适应特定任务,同时保留了基础模型的通用性。 用通俗的话来讲,嵌入就类似于你给一个经过综合训练的大学生一本工具书,让他拿着拥有特定任务相关知识的工具书去完成任务,他可以随时查阅工具书,然后可以解决特定的问题。 微调(Fine-tuning) 图 9:Fine Tuning 微调(Fine-tuning)与嵌入不同,通过更新已经预训练的语言模型的参数,使其适应特定任务。这种方法允许模型在特定任务上表现出更好的性能,同时保持通用性。微调的核心思想是调整模型参数,捕捉与目标任务相关的特定模式和关系。但微调的模型通用能力上限仍然受限于基座模型本身。 用通俗的话来讲,微调就类似于给经过综合训练的大学生上专业知识课程,让他掌握除了综合能力以外的专业课知识,能自行解决专业板块的问题。 重新训练 LLM 当前的 LLM 虽然强大,但不一定能够满足所有需求。重新训练 LLM 是一种高度定制化的解决方案,通过引入新数据集和调整模型权重,使其更适应特定任务、需求或领域。然而,这种方法需要大量计算资源和数据,并且管理和维护重新训练后的模型也是挑战之一。 Agent 模型 图 10:Agent 模型 Agent 模型是一种构建智能代理的方法,它以 LLM 作为核心控制器。这个系统还包括几个关键组成部分,以提供更全面的智能。 Planning,规划:将大任务分成小任务,这样更容易完成 Memory,反思:通过反思过去的行为,改进未来的计划 Tools,工具使用:代理可以调用外部工具获取更多信息,如调用搜索引擎、计算器等 人工智能代理模型具备强大的语言理解和生成能力,能够解决通用问题,进行任务分解以及自我反思。这使得它在各种应用中都有广泛的潜力。然而,代理模型也存在一些局限性,例如受到上下文长度的限制、长期规划和任务拆分容易出错、输出内容的可靠性不稳定等问题。这些局限性需要长期不断的研究和创新,以进一步拓展代理模型在不同领域的应用。 以上的各种技术并不是相互排斥的,它们可以在训练和增强同一个模型的过程中一起使用。开发者可以充分发挥现有大语言模型的潜力,尝试不同的方法,以满足日益复杂的应用需求。这种综合使用不仅有助于提高模型的性能,还有助于推动 Web3 技术的快速创新和进步。 然而,我们认为,虽然现有的 LLM 已经在 Web3 的快速发展中发挥了重要作用,但在充分尝试这些现有模型(如 OpenAI、Llama 2 以及其他开源 LLM)之前,我们可以从浅入深,从 prompt engineering 和嵌入等 RAG 策略入手,谨慎考虑微调和重新训练基础模型。 3.4 LLM 如何加速区块链数据生产的各个流程 3.4.1 区块链数据的一般处理流程 当今,区块链领域的建设者逐渐认识到数据产品的价值。这一价值覆盖了产品运营监控、预测模型、推荐系统以及数据驱动的应用程序等多个领域。尽管这一认知逐渐增强,但作为数据获取到数据应用中不可或缺的关键步骤,数据处理往往被忽视。 图 12:区块链数据处理流程 将区块链原始非结构化数据,如 events 或 logs 等,转换为结构化的数据 区块链上的每一笔交易或事件都会生成 events 或 logs,这些数据通常是非结构化的。这一步骤是获取数据的第一入口,但数据仍然需要被进一步处理以提取有用信息,得到结构化的原始数据。这包括整理数据、处理异常情况和转化为通用格式。 将结构化的原始数据,转换为具有业务意义的抽象表 在得到结构化原始数据后,需要进一步进行业务抽象,将数据映射到业务实体和指标上,比如交易量、用户量等业务指标,将原始数据转化为对业务和决策有意义的数据。 从抽象表中,计算提取业务指标 有了抽象的业务数据后,可以在业务抽象的数据上进行进一步计算,就可以得出各种重要的衍生指标。例如交易总额的月增长率、用户留存率等核心指标。这些指标可以借助 SQL、Python 等工具实现,更加有可能帮助监控业务健康、了解用户行为和趋势,从而支持决策和战略规划。 3.4.2 区块链数据生成流程加入 LLM 后的优化 LLM 在区块链数据处理中可以解决多个问题,包括但不限于以下内容: 处理非结构化数据: 从交易日志和事件中提取结构化信息:LLM 可以分析区块链的交易日志和事件,提取其中的关键信息,如交易金额、交易方地址、时间戳等,将非结构化数据转化为的带有业务意义的数据,使其更易于分析和理解。 清洗数据,识别异常数据:LLM 可以自动识别和清洗不一致或异常的数据,帮助确保数据的准确性和一致性,从而提高数据质量。 进行业务抽象: 将原始链上数据映射到业务实体:LLM 可以将原始区块链数据映射到业务实体,例如将区块链地址映射到实际用户或资产,从而使业务处理更加直观和有效。 处理非结构化链上内容,打标签:LLM 可以分析非结构化数据,如 Twitter 情感分析结果,将其标记为正面、负面或中性情感,从而帮助用户更好地理解社交媒体上的情感倾向。 自然语言解读数据: 计算核心指标:基于业务抽象,LLM 可以计算核心业务指标,如用户交易量、资产价值、市场份额等,以帮助用户更好地了解其业务的关键性能。 查询数据:LLM 可以通过 AIGC,理解用户意图,生成 SQL 查询,使用户能够以自然语言提出查询请求,而不必编写复杂的 SQL 查询语句。这增加了数据库查询的可访问性。 指标选择、排序和相关性分析:LLM 可以帮助用户选择、排序和分析不同的多个指标,以更好地理解它们之间的关系和相关性,从而支持更深入的数据分析和决策制定。 产生业务抽象的自然语言描述:LLM 可以根据事实数据,生成自然语言摘要或解释,以帮助用户更好地理解业务抽象和数据指标,提高可解释性,并使决策更具合理性。 3.5 目前用例 根据 LLM 自身的技术以及产品体验优势,它可以被应用到不同的链上数据场景,技术上从易到难可以将这些场景分成四类: 数据转换:进行数据增强、重构等操作,如文本摘要、分类、信息抽取。这类应用开发较快,但更适合通用场景,不太适合大量数据的简单批量化处理。 自然语言接口:将 LLM 连接知识库或工具,实现问答或基本工具使用的自动化。这可以用于构建专业聊天机器人,但其实际价值受其所连接的知识库质量等其他因素影响。 工作流自动化:使用 LLM 实现业务流程的标准化和自动化。这可以应用于较复杂的区块链数据处理流程,如解构智能合约运行过程、风险识别等。 协助机器人与助手辅助系统:辅助系统是在自然语言接口的基础上,集成更多数据源和功能的增强系统,大幅提高用户工作效率。 图 11:LLM 应用场景 3.6 LLM 的局限性 3.6.1 行业现状:成熟应用、正在攻克的问题以及尚未解决的挑战 在 Web3 数据领域,尽管已经取得了一些重要的进展,但仍然面临一些挑战。 相对成熟的应用: 使用 LLM 进行信息处理:LLM 等 AI 技术已成功用于生成文本摘要、总结、解释等工作,帮助用户从长篇文章、专业报告中提取关键信息,提高了数据的可读性和可理解性。 使用 AI 解决开发问题:LLM 已经应用于解决开发过程中的问题,例如替代StackOverflow 或搜索引擎,为开发者提供问题解答和编程支持。 有待解决与正在探索的问题: 利用 LLM 生成代码:行业正在努力将 LLM 技术应用于自然语言到 SQL 查询语言的转换,以提高数据库查询的自动化和可理解性。然而,过程中会有很多困难,比如在某些情境下,生成的代码要求极高的准确性,语法必须百分之百正确,以确保程序能够无 bug 运行,并获得正确的结果。难点还包括确保问题回答的成功率、正确率,以及对业务的深刻理解。 数据标注问题:数据标注对于机器学习和深度学习模型的训练至关重要,但在 Web3 数据领域,特别是处理匿名的区块链数据时,标注数据的复杂性较高。 准确性和幻觉(Hallucination)问题:AI 模型中幻觉的出现可能受多因素影响,包括有偏见或不足的训练数据、过度拟合、有限的上下文理解、缺乏领域知识、对抗性攻击和模型架构。研究人员和开发者需要不断改进模型的训练和校准方法,以提高生成文本的可信度和准确性。 利用数据进行业务分析和文章输出:将数据用于业务分析和生成文章仍然是一个具有挑战性的问题。问题的复杂性、需要精心设计的提示(prompt)、以及高质量的数据、数据量、减少幻觉问题的方法都是待解决的问题。 根据业务领域自动索引智能合同数据以进行数据抽象:自动为不同业务领域的智能合同数据建立索引以进行数据抽象仍然是一个未解决的问题。这需要综合考虑不同业务领域的特点,以及数据的多样性和复杂性。 处理时序数据,表格文档数据等更复杂的模态:DALL·E 2 等多模态模型非常擅长在文字生成图像、语音等常见模态。而在区块链以及金融领域需要特别地对待一些时序数据,而非简单地把文本向量化就能解决。联和时序数据与文本,跨模态联合训练等,是实现数据智能分析以及应用的重要研究方向。 3.6.2 为何只靠 LLM 不能完美解决区块链数据行业的问题 作为语言模型,LLM 更适用于处理对流畅度要求较高的场景,而在追求准确性方面,可能需要对模型进行更进一步的调整。在将 LLM 应用于区块链数据行业时,以下框架可提供一些参考。 图 13:区块链数据行业下 LLM 输出的流畅性、准确性和用例风险 在评估 LLM 在不同应用中的适用性时,关注流畅度和准确性是至关重要的。流畅度指的是模型的输出是否自然、通顺,准确性则表示模型的答案是否准确。这两个维度在不同应用场景中有不同的要求。 对于流畅度要求较高的任务,如自然语言生成、创意写作等,LLM 通常能够胜任,因为其在自然语言处理方面的强大性能使其能够生成流畅的文本。 区块链数据面临着数据解析、数据处理、数据应用等多方面的问题。LLM 拥有卓越的语言理解和推理能力,使其成为与区块链数据互动、整理和概括的理想工具。然而,LLM 并不能解决所有区块链数据领域的问题。 在数据处理方面,LLM 更适合快速迭代和探索性处理链上数据,不断尝试新的处理方法。然而,LLM 在生产环境中的详细核对等任务方面仍存在一些限制。典型的问题是 token 长度不够,无法应对长上下文的内容。耗时的 prompt,回答不稳定影响下游任务进而导致成功率不稳定的问题,以及执行大批量任务的效率不高。 其次,LLM 处理内容的过程中很可能出现幻觉问题。据估计,ChatGPT 的幻觉概率约为 15% 至 20%,而由于其处理过程的不透明性,很多错误难以察觉。因此,框架的建立和专家知识的结合变得至关重要。此外,LLM 结合链上数据还是有很多挑战: 链上数据实体类型多、数量庞大,以何种形式投喂给 LLM,有效地运用在具体的商业化场景,类似其他垂直行业,需要更多研究和探索。 链上数据包括结构化和非结构化数据,目前行业大多数数据解决方案,都是基于对业务数据的理解。解析链上数据的过程中,用 ETL 去过滤,清洗,补充和复原业务逻辑,进一步把非结构化数据整理为结构化数据,可以为后期多种业务场景提供更高效的分析。比如,结构化的 DEX trades,NFT marketplace transactions,wallet address portfolio 等,就具有前面提到的高质量,高价值,准确和真实等特点,可以给通用 LLM 提供高效的补充。 被误解的 LLM LLM 可以直接处理非结构化数据,因此结构化数据将不再被需要? LLM 通常基于海量文本数据预训练而来,天然适合处理各类非结构化的文本数据。然而,各个行业已经拥有大量结构化数据,尤其 Web3 领域中解析后的数据。如何有效的利用这些数据,增强 LLM,是一个行业的热门研究课题。 对于 LLM,结构化数据仍然具有以下的优势: 海量:大量的数据储存在各种应用背后的数据库和其他标准格式里面,特别是私有数据。每个公司和行业都还有大量 LLM 没有用于预训练的墙内数据。 已有:这些数据不需要重新生产,投入成本极低,唯一的问题是怎么用起来。 高质量和高价值:领域内长期积累的,蕴含专家的专业知识,通常都沉淀到了结构化数据里面,用于产学研。结构化数据的质量是数据可用性的关键,其中包括数据的完整性、一致性、准确性、唯一性和事实性。 高效率:结构化数据以表格、数据库或其他规范格式存储,模式是预先定义的,并且在整个数据集中保持一致。这意味着数据的格式、类型和关系都是可预测和可控的,使得数据的分析和查询更加简单和可靠。而且,行业已经有成熟的 ETL 及各种数据处理和管理工具,使用起来也更加高效和便捷。LLM 可以通过 API,把这些数据使用起来。 准确性和事实性:LLM 的文本数据,基于 token 概率,目前还不能稳定的输出确切的答案,产生的幻觉问题一直是 LLM 要解决的核心根本问题。对于很多行业和场景,会形成安全和可靠性问题,比如,医疗,金融等。结构化数据,正是可以辅助和矫正LLM 这些问题的一个方向。 体现关系图谱,和特定业务逻辑:不同类型的结构化数据,可以以特定的组织形式(关系型数据库,图数据库等),输入到 LLM,解决不同类型的领域问题。结构化数据使用标准化的查询语言(如 SQL),使得对数据进行复杂的查询和分析变得更加高效和准确。知识图谱 (Knowledge Graph) 可以更好地表达实体之间的关系,也更容易进行关联查询。 使用成本低:不用 LLM 每次重新从底层重新训练整个底座模型,可以结合 Agents 和LLM API 等 LLM 赋能方式,更快更低成本的接入 LLM。 目前市场上还有一些脑洞大开的观点,认为 LLM 在处理文本信息和非结构化信息方面的能力极强,只需将原始数据,包括非结构化数据,简单导入到 LLM,就能达到目的。这个想法类似于要求通用 LLM 解数学题,在没有专门构建数学能力模型的情况下,大多数 LLM 可能会在处理简单的小学加减题时出错。反而,建立类似数学能力模型,和图像生成模型的 Crypto LLM 垂直模型,才是解决 LLM 在 Crypto 领域更落地的实践。 4.2 LLM 可以从新闻、推特等文字信息推测内容,人们不再需要链上数据分析来得出结论? LLM 虽然可以从新闻、社交媒体等文本中获得信息,但直接从链上数据中获得的洞察仍然是不可或缺的,主要原因有: 链上数据是原始的第一手资讯,而新闻和社交媒体中的信息可能存在片面性或误导性。直接分析链上数据可以减少信息偏差。尽管利用 LLM 进行文本分析存在理解偏差的风险,但直接分析链上数据可以减少误读。 链上数据包含全面的历史交互和交易记录,分析可以发现长期趋势和模式。链上数据还可以展现整个生态系统的全貌,如资金流向、各方关系等。这些宏观的洞察有助于更深入地理解状况。而新闻和社交媒体信息通常更零散且短期。 链上数据是开放的。任何人都可以验证分析结果,避免信息的不对称。而新闻和社交媒体未必都如实披露。文本信息和链上数据可以相互验证。综合两者可以形成更立体和准确的判断。 链上数据分析仍是不可或缺的。LLM 从文本中获取信息具有辅助作用,但不能取代直接分析链上数据。充分利用两者优势才能取得最佳效果。 4.3 利用 LangChain、LlamaIndex 或其他 AI 工具,在 LLM 的基础上构建区块链数据解决方案非常容易? LangChain 和 LlamaIndex 等工具为构建自定义的简单 LLM 应用提供了便利,使快速搭建成为可能。然而,将这些工具成功应用于实际生产环境中涉及到更多的挑战。构建一个高效运行、保持高质量的 LLM 应用是一项复杂的任务,需要深入理解区块链技术和 AI 工具的工作原理,并有效地将它们整合在一起。这对于区块链数据行业来说,是一项重要但具有挑战性的工作。 在这个过程中,必须认识到区块链数据的特性,它要求极高的精准性和可重复校验性。一旦数据通过 LLM 进行处理和分析,用户对其准确性和可信度有很高的期望。这与 LLM 的模糊容错性之间存在着潜在的矛盾。因此,在构建区块链数据解决方案时,必须仔细权衡这两方面的需求,以满足用户的期望。 当前市场上,虽然已经有了一些基础工具,但这个领域仍在快速演进和不断迭代。类比于 Web2 世界的发展历程,从最初的 PHP 编程语言到更成熟、可扩展的方案如 Java、Ruby、Python,以及 JavaScript 和 Node.js 等,再到 Go 和 Rust 等新兴技术,都经历了不断的演变。AI 工具也在不断变化,新兴的 GPT 框架如 AutoGPT,Microsft AutoGen,及最近OpenAI 自己推出的 ChatGPT 4.0 Turbo 的 GPTs 和 Agents 等只是展示了未来可能性的一部分。这表明,区块链数据行业和 AI 技术都还有许多发展空间,需要不断努力和创新。 当前在应用 LLM 时,有两个陷阱需要特别注意: 期望值过高:很多人认为 LLM 可以解决一切问题,但实际上 LLM 有明显的局限性。它需要大量的计算资源,训练成本高昂,而且训练过程可能不稳定。对 LLM 的能力要有现实的期望,明白它在某些场景下表现出色,如自然语言处理和文本生成,但在其他领域可能无法胜任。 忽视业务需求:另一个陷阱是强行应用 LLM 技术,而不充分考虑业务需求。在应用 LLM 之前,务必明确具体的业务需求。需要评估 LLM 是否是最佳技术选择,并做好风险评估和控制。强调 LLM 的有效应用需要根据实际情况慎重考虑,避免误用。 尽管 LLM 在许多领域都具备巨大潜力,但开发者和研究者在应用 LLM 时需要保持谨慎,采取开放的探索态度,以找到更适合的应用场景并最大程度地发挥其优势。 关于Footprint Analytics Footprint Analytics是一家区块链数据解决方案提供商。借助尖端的人工智能技术,我们提供 Crypto 领域首家支持无代码数据分析平台以及统一的数据 API,让用户可以快速检索超过 30 条公链生态的 NFT,GameFi 以及 钱包地址资金流追踪数据。 关于Future3 Campus Future3 Campus是由万向区块链实验室和HashKey Capital共同发起的Web3.0创新孵化平台,重点聚焦Web3.0 Massive Adoption、DePIN、AI三大赛道,以上海、粤港澳大湾区、新加坡为主要孵化基地,辐射全球Web3.0生态。同时,Future3 Campus将推出首期5000万美金的种子基金用于Web3.0项目孵化,真正服务于Web3.0领域的创新创业。 来源:金色财经
lg
...
金色财经
2023-12-06
上一页
1
•••
970
971
972
973
974
•••
1000
下一页
24小时热点
市场周评:俄乌冲突骤然升级!普京重大宣布 金价暴涨近153美元 油价飙升逾6%
lg
...
中国房地产突传“撤资”利空!新加坡资管巨头:将大幅削减对华仓位……
lg
...
重磅!特朗普提名这位对冲基金经理为财政部长 将负责执行提高关税和减税
lg
...
金价惊人暴涨后技术面大变脸!FXStreet分析师黄金下周预测 这些因素恐引爆行情
lg
...
中美重磅!彭博专栏:特朗普贸易战曾让中国措手不及 但中国领导人这次准备好了
lg
...
最新话题
更多
#SFFE2030--FX168“可持续发展金融企业”评选#
lg
...
14讨论
#链上风云#
lg
...
47讨论
#美国大选#
lg
...
1326讨论
#VIP会员尊享#
lg
...
1495讨论
#比特币最新消息#
lg
...
602讨论