简介:针对现有页岩气储集层总有机碳含量预测模型存在的模型泛化能力弱、稳定性差的问题,提出了一种利用随机森林回归算法预测储集层总有机碳含量的方法。该方法使用地球物理测井提供的密度、铀含量、钍含量、自然伽马及光电吸收截面吸收指数等测井响应值作为输入,岩芯实验总有机碳含量作为输出,通过学习输入曲线与总有机碳含量的函数关系,动态预测整口井的总有机碳含量曲线。通过对焦石坝地区两口页岩气探井建模及预测可知,当随机森林中树的数量达到500时,建立的模型即可对训练样本中输入与输出的函数关系进行完全学习。通过训练结果及预测结果可知,随机森林回归方法不易发生过拟合现象,泛化能力极强,同时预测得到的曲线更为平滑,预测总有机碳含量较其他方法更为准确,有效地提高测井信息预测总有机碳含量模型的精度,对页岩气储集层评价提供帮助。
简介:摘要实施科学是一门研究方法的学科,旨在实践和政策中促进循证干预措施的系统实施,进而改善健康。尽管实施研究需要高质量的证据,但实施策略的随机试验往往存在较为严重的局限性。这些局限性包括存在偏倚风险、缺乏理论运用、缺乏描述实施策略标准术语、局限于实施结局以及不充分报告。本文旨在对实施策略随机试验的设计、实施和报告提供指导,以提升循证实施科学。由研究人员、卫生政策制订者和实践者组成的国际小组整合了构建随机试验方法的重要文献和实施科学的最新进展。本文为实施策略随机试验的主要内容提供指导,包括试验目的阐明、试验中人员招募和保留策略、随机设计的选择、实施科学理论和框架的使用、测量(结局指标)、样本量计算、伦理审查和试验报告。本文也关注了实施试验中需要特别重视或调整的主题。为了推进实施策略随机试验的严格开展和报告,我们建议将本指南作为研究人员、卫生保健和公共卫生政策制订者或实践者、研究资助者和期刊编辑的参考资料。
简介:摘要目的探讨基于随机森林模型分析内脏脂肪等级的相关指标。方法本研究为横断面研究,选取2021年3—9月在黑龙江省医院健康管理中心进行体检的医院职工(包括在职职工和退休职工)共617例的各项实验室指标以及体成分分析各项指标,按照2∶1的比例将样本分为训练集(411例)和测试集(206例),模型共纳入预测变量110个,使用训练集数据进行随机森林模型构建,测试集数据进行模型验证,选择最优节点数和决策树数目,对构建模型的预测性能进行评价,同时选取重要性在前10位的相对重要因子进行下一步的研究。按内脏脂肪等级,对617名研究对象再次进行分组:内脏脂肪等级正常组和内脏脂肪等级偏高组,进一步分析前10位相对重要因子在组间的差异。结果随机森林模型的最优节点数为39、决策树数目为300。模型在测试集上的准确率为83.3%、精确率为73.9%、灵敏度为89.4%、特异度为78.7%,其受试者工作特征曲线下面积为0.881(95%CI:0.832~0.931)。模型中前10位相对重要因子依次为:体重指数、性别、年龄、尿酸、红细胞计数、单核细胞计数、C肽、癌胚抗原、糖化血红蛋白、谷氨酰转肽酶。内脏脂肪等级偏高组的体重指数、年龄、尿酸、红细胞计数、单核细胞计数、C肽、癌胚抗原、糖化血红蛋白、谷氨酰转肽酶水平均高于内脏脂肪等级正常组(均P<0.05);内脏脂肪等级偏高的发生率男性大于女性(P<0.05)。结论本研究构建的内脏脂肪等级的随机森林预测模型表现良好,内脏脂肪与机体肝功能、胰岛功能、免疫功能的改变均有关系。
简介:摘要目的了解儿科危重病随机对照试验(randomized control trials,RCTs)作者的性别分布。数据资源2019年前发布的415项儿科重症监护RCTs。研究选择本文包含纳入PICU患儿的所有RCTs。本文使用PICUtrials.net,其使用多个数据库的综合检索策略来识别已发表的RCTs。数据提取本文作者手动提取每篇发表研究中每一位署名作者的姓名和职业,并根据其姓名区分男性或女性。结果本文纳入2146名作者,其中1888名(88%)可区分男/女性。总体而言38%作者为女性,该比例随作者排序位置变化:37%第一作者,38%排序中间,25%排序最后(P<0.001)。最常见的三个职业是医生(63%)、非临床医生(11%)和护士(6%),其中女性分别占30%、45%和97%。总体女性作者比例从1985至1989年的28%升至2015至2018年的39%(趋势P=0.004)。以女性为第一作者或最后作者发表的RCTs与以男性为第一作者和最后作者的RCTs在以下研究特点上并无显著差异,包括随机化儿童中位数(60 vs.50,P=0.41),多中心试验比例(17% vs.24%,P=0.12),低偏倚风险试验比例(50% vs.66%,P=0.26),报告任何资助比例(55% vs.51%,P=0.66)或年均被引中位数(1.5 vs.2.4,P=0.09)。结论尽管随时间增加,发表儿科危重监护RCTs的研究人员中女性比例仍然落后于女性临床医生比例。女性研究人员发表文章的试验特点和影响与男性研究者相似。下一步研究应确定影响儿科重症监护研究中性别多样性的障碍和可能的解决方案。
简介:为提高光电平台的控制性能和稳定性,以平台反馈回路所用的光纤陀螺传感器为研究对象,对光纤陀螺角速率的历史输出、当前量测以及随机漂移进行融合补偿。采用双自回归模型确定了光纤陀螺时间序列输出的自回归多项式和光纤陀螺随机漂移的自回归关系。以陀螺当前输出为量测量,结合卡尔曼滤波算法将陀螺历史输出和历史随机漂移融合进状态方程,并进行随机漂移在线估计补偿。实验结果表明,光纤陀螺随机漂移的AR模型能达到90%拟合效果,经卡尔曼滤波补偿后随机漂移能降到1/10。该方法能很好地抑制光电平台三个框架轴光纤陀螺的随机漂移,补偿率为80%~90%。
简介:主要研究ψ-混合随机变量序列部分和的强大数定律,并且得到了一些新结果.在混合系数满足一定条件时,本文的结果推广了独立序列的相应结果.
简介:为提高基于随机森林算法重复拨打投诉预警模型的效果,文章从数据、指标、参数3个方面对模型进行优化。在数据处理方面,利用SMOTE算法平衡投诉与非投诉比例,一方面防止了模型出现过拟合;另一方面消除了非平衡数据对模型效果的影响。在特征选择方面,使用基尼系数进行特征选择,从而减少数据的噪声,提高模型预测的准确度。在参数调整方面,使用R语言软件对模型决策树数量参数和最大特征参数进行调整,模型最终的OOB误差率为5.03%,准确率和召回率均超过70%。目前投诉预警模型已经进行试点应用,实现了投诉业务的提前识别,通过采用相应服务策略,减少了服务升级事件,降低了客户投诉率,有效提升了客户感知。