- DP Leads

Posted on February 29, 2024 by ehinx

接下来将概述用于分析的输入数据的常见来源。聚合异构数据源以进行人工智能预测为了优化预防性应用程序问题建议，AI ML 应用程序开发模型需要与代码库质量和运行时应用程序性能相关的大量上下文丰富的信号。在整个开发流程中收集的各种数据为人工智能应用程序开发提供了多维视角，以便从中获得最准确的见解。 AI 应用程序开发分析的常见输入数据来源包括：应用程序源代码- 像 GitHub 这样的现代源代码托管包含大量有关代码库演变、贡献者倾向、依赖关系变化、代码流失率、过去崩溃的修复、模块化模式等的历史信号。代码修订历史的静态分析为运行前的未来可靠性风险提供了强大的领先指标。构建和集成检查- 持续集成平台在应用程序发布之前强制实施广泛的质量关卡，为安全性、性能、编码约定、依赖性等维度生成通过/失败信号。尽管有其他测试形式，但失败仍能查明质量热点存在的地方。 ‍

单元和端到端测试 – 开发人员编写的单元测试单独运行关键组件，而 QA 自动化套件则验证主要的端到端流程。测试覆盖率指标与通过/失败信号相结合，可识别验证不足的薄弱环节。测试还生成性能基准数据。手动 QA 错误报告 – 人类测试人员拥有独特的才能，可以在不同平台上对复杂的应用程序流程进行探索性测试，而自动化测试无法轻松复制。分析手动发现的缺陷的文本描述可以进一步了解让用户感到沮丧的原因。用户支持票- 通过聚合来自应用程序支持渠道的众包问题报告，可以识别可靠性痛点和季节性使用变化影响的模式。自然语言处理有助于大规模分类非结构化文本票据数据。 ‍ 应用复杂的机器学习算法来查明软件风险许多类别的高级机器学习方法可以从前面描述的软件数据中解锁预防性、预测性的见解。不同的AI ML 应用程序开发技术擅长识别对整体应用程序稳定性至关重要的特定类别的弱点或性能瓶颈。

常见的算法类别包括：无监督异常检测 – 通过使用集群、隔离森林和降维技术深入分析使用遥测、代码提交或测试失败的模式，可以标记异常偏差以进行调查，而无需任何历史标记。例如，具有不常见 UI 操作序列的会话可能会导致工作流程混乱。自然语言处理 – 使用 NLP 情感分析、主题建模和文本嵌入来解析非结构化文本数据，例如用户评论、支持票证、测试人员评论或文档，可以发现用户描述的自动化测试遗漏的令人沮丧的体验。时间序列预测- 应用程序负载的季节性波动、平台采用变化和代码库演变模式都会影响未来的可靠性风险。配备相关上下文数据的 LSTM、ARIMA 和 Facebook Prophet 等高级时间序列模型可以提前数月预测多个风险类别，以便及早确定优先级。 ‍ 回归模型训练- 逻辑回归、随机森林和梯度提升机等监督学习方法将代码质量指标、架构模式、测试信号和操作指标等因素与之前的应用程序崩溃相关联。

Leave a Reply Cancel reply