在信息急剧增长的时代,科研工作者们往往面临着海量的文献资料和繁琐的数据处理任务。为了帮助大家更高效地进行水科学领域的研究,北京大学环境科学与工程学院基于百度文心大模型推出了全新的水科学研究助手——WaterScholar!它基于强大的文献数据库和检索增强技术 RAG,让您轻松查询文献、梳理引言、总结内容、回答问题,现已在星河社区上线,欢迎相关领域专业人士与高校师生体验!

01 

 响应科研需求,创新科技助力 

水科学作为一门综合性学科,涉及水文水循环、给排水、水环境化学、水污染控制、水生态修复与保护、水系统可持续管理、气候变化等研究领域,与泥沙、矿物质、盐类、有机质、溶解性气体、重金属、化学污染物、蛋白质、藻类、浮游动物、鱼类、鸟类、水生植被等物质或生命体关系密切,其研究内容广泛而复杂,发表的相关文献累积已超过1500万篇,并且每年正在以超百万量级的速度增长。

注:信息来自Web of Science

水科学研究领域对整理大量的科研文献的需求愈发强烈,然而,传统的文献检索和信息整理方式往往耗时耗力,难以满足深入挖掘潜在信息、梳理前沿进展、探索问题新方案等日益增长的需求。水科学研究范式亟需拓展,尤其是文献梳理、知识学习以及科研辅助。

因此,北京大学环境科学与工程学院刘永教授研究组携手百度 AI,推出水科学研究助手WaterScholar,旨在通过智能化的方式,简化科研流程,提高研究效率,让科研工作者们能够更专注于研究本身,发掘更多有价值的科研成果。更多信息请前往官网介绍(https://www.waterscholar.com)。

体验链接(请登录后使用,多工具智能编排邀测中,分钟级通过白名单审核)

https://aistudio.baidu.com/community/app/70479/webUI


 02 

 轻松上手,知识速成 

WaterScholar 基于飞桨星河社区(AI Studio)平台开发,底层大模型为文心大模型。目前阶段实现的主要功能为查询水相关领域文献、围绕关键词撰写引言、总结概括简化内容、根据文献回答问题,希望能为对水科学研究领域感兴趣的用户提供帮助,包括研究人员、学生、工程师等。



■ 功能1:查询水相关领域文献

  • 功能描述: 根据提供的关键词信息在数据库中检索相关的文献信息,并生成相应的文本文件;

  • 返回结果: 返回查询到的文献内容、下载链接和提示信息。


■ 功能2:围绕关键词撰写引言

  • 功能描述: 根据传入的关键词撰写水科学领域的英文引言,引言长度在800-1200词之间,内容包括研究问题的重要性、相关研究进展、存在的问题或不足、以及将要开展的研究内容;

  • 返回结果: 返回撰写好的英文引言内容和提示信息。

■ 功能3:总结概括简化内容

  • 功能描述: 根据传入的文献摘要内容进行总结,并去除无关信息,返回简要介绍;

  • 返回结果: 返回总结后的文献摘要内容和提示信息。

■ 功能4:根据文献回答问题

  • 功能描述: 根据文档内容回答提供的问题;

  • 返回结果: 返回根据文档内容回答问题的结果和提示信息。


 03 

 技术方案:文献数据库+RAG

 智能处理更高效 

WaterScholar 的强大功能得益于其背后的两大核心:文献数据库和 RAG 技术。首先,数据库基于在线文献数据集(英文),获取到水科学领域的关键文献清单。其中文献来自于水科学领域数千种学术期刊和会议,数量超过300万篇,信息包含题目、摘要、作者、时间、研究对象、研究问题与方法等。通过语义相似性匹配等智能搜索算法从文献摘要信息中快速准确地找到与用户关键词相关的文献列表,处理为可下载的文件链接。链接分为两部分:文献清单与文献摘要,提供丰富的研究素材,用户可下载文件并在本地阅读与使用。其次,RAG(Retrieval-Augmented Generation)是一种将检索技术与语言生成技术相结合的创新方法,旨在提高搜索结果的准确性和多样性,实现对文献内容的深度理解和智能处理。它能够自动提取文献中的关键信息,生成高质量的引言和总结,并根据用户的需求提供有针对性的回答,提高了工作效率,降低人为因素导致的误差和遗漏。

WaterScholar 充分发挥了北大环境学院在专业领域的资源优势和百度文心大模型的技术优势。首先,文心大模型的解析调度模块可根据用户输入确定是否使用工具 API 及解析参数取值,并发出启用服务命令;WaterScholar 收到请求后提取 API 需要的参数,完成文献查询、结果处理、文件生成等功能,并将其摘要缓存在服务器端;工具服务完成处理后,以 json 格式返回由摘要缓存、用户需求、prompt 模板形成的数据;文心大模型汇总结果并按要求智能生成答案。


 04 

 团队介绍 

 

刘永

北京大学教授、环境科学与工程学院院长

国家环境保护河流全物质通量重点实验室副主任

主要研究方向为湖泊-流域过程与调控,主持国家水专项、973计划青年项目等,发表 SCI 论文150余篇,出版第1作者专著5部;获中国青年科技奖、中国生态环境十大科技进展等,兼任教育部科技委委员、Limnology and Oceanography 副主编等。


蒋青松

北京大学环境科学与工程学院助理研究员

主要研究方向为流域科学与机器学习算法,发表论文17篇,以第一作者申请授权软件著作权6项,出版专著2部;获国家青年自然科学基金项目资助。


 05 

 常见问题解答,让您更放心使用 

为了让大家更好地使用 WaterScholar,整理一些常见的问题和解答:

■ Q1: WaterScholar 与相似产品有何不同?

本项目开展的 WaterScholar 将更加聚焦于水体研究领域,虽然涉及众多自然学科,但主体围绕水体进行知识问答或引言梳理,提供更加专业性的事实依据和知识生成服务。

■ Q2: 文献如何实现匹配与排序?

目前 WaterScholar 通过后端程序实现云端数据库的访问,根据用户查询文献时输入的关键词与数据库中的文献摘要计算文本相似性,按照相似性得分高低排序,并返回前20篇文献。

■ Q3: 文献来源是否真实可靠?

文献全部来自于 SCI 数据库,保留了含有摘要的300余百万篇文献,信息来源真实可靠;包含的信息还包括年份、题目、作者、DOI 链接、期刊、关键词、引用数、研究领域等。

■ Q4: WaterScholar是否支持多种语言?

目前,WaterScholar 主要支持中文和英文,其中查询文献时建议使用英文关键词进行检索,使专业术语的语义匹配更准确;后续逐步增加对其他语言的支持。

■ Q5: 我是否可以修改生成的提示词?

生写一段质量较好的答案需要复杂的提示词,包括对文字长短、内容要点、格式等方面的约束。目前已经在工具中准备了必要的提示词,但用户可以明确提出自己重点关心的问题,大模型据此关键要点进行引言梳理。

■ Q6: WaterScholar 生成的引言和总结是否可以直接用于论文?

WaterScholar 生成的引言和总结是基于文献内容的智能提取和整理,可以作为论文的参考素材。但建议您在使用前进行修改和完善,以确保符合论文的专业要求和风格。

■ Q7: 使用 WaterScholar 是否免费,访问需要国外 VPN?

WaterScholar 完全免费,在国内联网条件下直接使用即可。

■ Q8: 如何提交使用反馈意见?

可进入问卷星(https://www.wjx.cn/vm/t2VFw02.aspx),完成问卷需花费一分钟左右,感谢您提出宝贵意见!


 06 

 未来优化升级计划 

随着人工智能技术发展和科研需求的不断变化,该项目将在北大环境学院以及相关领域推广试用,持续优化 WaterScholar 的功能与性能。主要计划如下:

(1)完善文献数据库,补充中文期刊文献数据,增加更多的学术资源和数据支持;

(2)紧跟技术发展,增加大语言模型对长文本的支持能力;

(3)加强 RAG 技术的研究和应用,将目前的段落级别匹配提升为语句级别识别,提高智能处理的准确性和效率;

(4)升级 WaterScholar 为 AI Agent 模式,增加数据分析、多角色交互、调用外部工具等功能;

(5)优化工具访问速度。

相信 WaterScholar 将成为水科学研究领域不可或缺的重要工具,为科研工作者们提供更加便捷、高效的服务。诚邀广大科研工作者们前来体验 WaterScholar 的魅力,携手推动水科学研究的进一步发展!请前往星河社区平台使用,开启您的智能科研之旅吧!


来源:https://mp.weixin.qq.com/s/UJnbv7RRb4DnSzFYf5MWcA