Penguin程序是一款开源Python工具,支持耦合簇和微扰理论方法(如CP、MP2)的分子特性与光谱计算,首次在开源软件中实现簇微 ...
船舶碰撞风险实时监测方法基于缓冲区与增量HDBSCAN聚类,自适应识别高密度高风险区域,并量化碰撞风险。 随着全球海上交通的日益复杂,船舶碰撞风险的实时监测已成为确保海上运输安全的关键任务。当前的研究主要集中在船舶之间的碰撞风险评估,但在 ...
Python是数据分析、数据挖掘和机器学习领域经常使用的一种编程语言。在计算平台平台上,有两种使用Python的方式: JupyterLab和VSCode在共享集群中提交作业,共享集群的介绍和使用方式详见文档 其中,第一种方式适合对Linux不太熟悉的用户,第二种方式适合有 ...
在一项新的研究中,来自瑞士苏黎世联邦理工学院、瑞士生物信息学研究所和韩国首尔国立大学等研究机构的研究人员通过开发一种有效的方法来比较 AlphaFold 数据库中的所有预测蛋白结构,揭示了不同物种蛋白 在一项新的研究中,来自瑞士苏黎世联邦理工学院 ...
通过主题建模,你可以收集非结构化数据集,分析文档,并获得相关和所需的信息,这些信息能帮你做出更好的决策。 执行主题建模有不同的技术(如LDA),但是在本NLP教程中,你将学习如何使用Maarten Grootendorst开发的BerTopic技术。 什么是 BerTopic? BerTopic是一种 ...
近期,经常有小伙伴会在公众号后台或者直接通过微信向我咨询以下问题: 如何对大量的短文本数据进行高效建模? 在LDA建模时,如何确定主题数? 主题模型得到的结果解释性程度不高、看不懂咋办? 在没有任何类别或标签的情况下,利用无监督技术来提取 ...
作者:张丹,R语言中文社区专栏特邀作者,《R的极客理想》系列图书作者,民生银行大数据中心数据分析师,前况客创始人 ...
Tree-based Deep Match(TDM)是由阿里妈妈精准定向广告算法团队自主研发的基于深度学习上的大规模(千万级+)推荐系统算法框架。在大规模推荐系统的实践中,基于商品的协同过滤算法(Item-CF)是应用较为广泛的,而受到图像检索的启发,基于内积模型的向量 ...