2025年2月21日,海南师范大学DeepSeek-R1(671B)“满血版” 本地服务重磅上线,成为海南省首家上线满血版DeepSeek的高校,也是全国首批“满血版”DeepSeek本地化部署的高校。上线至4月1日,DeepSeek累计回答师生问题11276条。为进一步深度挖掘师生对AI服务的关切点,通过对这些数据的时间、关键词、用户行为和语言内容等进行分析,以期掌握学生的提问行为模式、关注焦点与个性化需求。
高频词分析
高频词统计能够直观反映师生在提问中关注的主题与领域。本分析对所有文本首先进行分词处理和词频统计,结合matplotlib和wordcloud等可视化工具,绘制关键词的词表和词云图,直观展示师生在平台上讨论最频繁的话题。
图1 师生提问的高频词词云图
从图1高频词分布来看,师生最常提及的词语为“研究”,出现频率高达3603次,表明科研与项目类问题在整个平台中占据核心地位。其次,“文化”和“发展”分别出现2426次和1708次,也具有较高热度,说明师生对社会文化、非遗传承等主题有着较高的关注度。“海南”一词频次达到1624次,体现出地域属性在师生提问中的广泛渗透。除此之外,“教学”“教育”“设计”“理论”、“技术”“中国”“内容”“学习”“社会”等高频词,也反映出师生主要聚焦于学术研究、专业发展、课程教学等方面,具有明显的学习导向和专业导向特征。
词云图进一步强化了上述观察。词云图通过词频可视化,将高频关键词以字体大小和色彩分布的形式展现出来。图中“研究”“教学”“发展”“师生”“海南”“教育”等词汇字体明显突出,再次验证其在整体数据中的高出现频率。图中还出现了如“非遗”“旅游”“对话”“分析”“方法”“项目”“模型”“中国”等具有本地要素或专业术语色彩的词汇,说明师生关心本地区域文化、知识学习和科研研究等内容。
对关键词频率分析不仅揭示了师生在使用平台过程中的主要关注点,还表明他们的提问呈现出多元化、实践化、地域化的特征。相关教育部门与教学管理人员可据此进一步优化内容资源推荐、提升答疑系统精准度,推动学术服务的智能化与个性化水平。
关键词趋势分析
词表词频反映了师生当前的关切点。为了直观感受师生关注的趋势变化,进一步将时间戳与内容数据进行关联。通过关键词匹配,提取师生关切的“教育”“研究”“发展”“文化”“海南”等关键词,按天统计各关键词的提及次数,并使用pandas和matplotlib工具完成折线图的绘制。图2展示了师生提问的高频关键词在每日变化趋势。可以看出,“教育”与“研究”这两个关键词,在整个时间段内始终处于较高关注度,表明师生在这一阶段对学术发展、教育资源或研究方向存在集中提问或讨论需求。而“论文”一词的波动较为平稳,但在3月上旬有一次明显增长,可能与临近某个科研活动或者论文提交等研究计划相关。
图2 关键词的时间变化趋势
同时,“文化”和“交流”这两个关键词虽然整体提及频率不如“教育”与“研究”高,但其曲线走势相对稳定,说明在师生的学习过程中,文化背景和交流互动是一个持续关注的话题。
综合来看,关键词的时间变化体现出师生关注趋势,其中“教育”“研究”“论文”等是关注核心,而“文化”“交流”则表现出更具人文或交往属性的精神维度。
提问时间分布
师生提问的时间分布研究,一方面可以根据时间适当调整算力分配策略,另一方面可以更有针对性地及时回复师生关切问题。以小时为单位进行分析,从表1可以看出,师生在10点至23点之间较为活跃,尤其是15点至17点期间提问量达到高峰。这反映出师生的提问时间与课余时间安排密切相关,晚间提问频次的增加也说明部分学术讨论学习可能集中在非上课时间。
表1 师生提问时间分布表
关键词共现分析
师生关切的关键词明显呈多元化,其中本地文化是师生持续的关注点之一。以“海南”为中心词,使用networkx构建了一个高频共现词的网络关系图,用于揭示师生关注“海南”时关联的核心话题。网络关系图以关键词作为中心节点,将共现词作为连接节点边的粗细表示共现频率,边权越大,表示共现越频繁。
在“海南”这一核心关键词的共现网络图中,可以明显看出它与多个语义关联紧密的关键词构成了丰富的主题网络。较为突出的共现词包括“文化”“建设”“旅游”“教育”“研究”“自贸港”“师大”“热带雨林”等,显示出用户对“海南”在文化传承、生态资源、教育发展及政策战略等方面表现出高度关注。
例如,“自贸港”体现了师生对国家战略背景下海南发展的敏感性,社会热点及区域发展等。而“文创”“热带雨林”“传统” 等词,则突出了本地自然与文化资源的重要位置。
值得注意的是,一些更具地方特色的关键词如“老爸”“长臂猿”也出现在网络图中。其中“老爸”应理解为“老爸茶”文化的简称,这是海南极具代表性的地域性生活方式和文化符号。此外,“背景”“生态”“学院”“生活”等词语,进一步揭示了师生们提问内容的多元性和地方性。
通用性与个性化问题分析
通用性问题
通用性问题则是指重复频率较高、内容通用的问题。询问8次以上的通用性问题分布见表2。师生提问主要是向Deepseek求助,其中接入性问候居多,体现了人与机器之间没有强烈的距离感,体现了智能机器的人性化和广大师生的普遍接纳心理。第二类问题是希望对deepseek进一步了解,反映了广大师生们对AI应用的进一步深入探索。第三类问题是希望增进对校园的了解, 表明师生的母校感情和关心。
表2 询问8次以上的通用问题列表
个性化问题
为更深入了解师生提问的关注点,采用LDA(Latent Dirichlet Allocation)主题建模方法,对师生提出的个性化问题文本进行无监督主题识别。LDA模型能够从大规模文本中学习出“词—主题”和“主题—文档”之间的潜在概率关系,从而提取出每个主题所代表的核心关键词,进而帮助学校进一步理解师生关心的主要话题。通过分析师生提出的所有问题文本,自动聚类出了三个主要话题。每个主题由一组高概率的关键词构成,反映出师生提问内容的核心语义特征。
教育发展类主题。关键词如“传统、社会、技术、理论、教育、研究、发展、海南、文化”等,体现了师生对教育政策、社会进步与区域发展的关注,整体问题内容具有师范类大学的宏观视角。
社会文化类主题。关键词包括“报道、文化、新闻、南海、文创、孩子、父母、海洋、研究”等,涵盖社会现实、家庭关系与地方文化,说明师生普遍关注社会热点与文化传播相关议题。
学习科研类主题。高频词汇如“论文、内容、教师、对话、师生、学习、教学、分析”等,聚焦学术写作、课堂交流与学习过程,反映了师生在学习与科研实践中的具体需求。
从LDA主题建模结果来看,“教育发展类”问题数量最多,占总问题数的55.2%,关键词集中在“学习”“教学”“论文”“教师”等,这表明师生在平台上的提问多数聚焦于课程内容理解、学术规范探讨与论文写作相关内容,体现出平台在辅助教学和学术交流方面的重要作用,也凸显了师生对学术提升和专业能力训练的高度重视。
“社会文化类”与“学习科研类”问题分别占比28.5%和16.4%。前者主要涉及社会热点、文化传播与个人经验等主题,显示师生对于公共话题具有一定的关注和表达欲望。后者则更偏向具体论文分析和对学习方法的关注,可能反映出师生在学习路径中对案例分析与教学实践的探索需求。
问题回答分析
情感分析
为更客观了解AI助手的回答质量,对Deepseek回答的文本进行情绪分析,从而间接分析用户对AI的满意度。采用基于RoBERTa架构的中文预训练模型,通过构建文本数据集并使用批量推理方式,获取AI助手每条回答的正向情绪得分,得分越接近1代表情绪越积极,结合Seaborn进行分布可视化,反映AI回应的整体情绪倾向。

图3 Deepseek回答的情感分布
从图3中可以看出,AI助手生成的回答整体情绪倾向积极,情绪得分集中分布在0.85至1.0区间,尤其在0.9以上频次最高。这说明AI助手在回应用户问题时,整体语气积极、语态正面,有助于提升用户的接受度与满意度。说明系统在绝大多数情境下能够保持情绪稳定与表达友好,负面表达或偏冷情绪非常少,符合教育服务类AI系统的人机沟通需求。
高频词与语言风格
AI回答本身并没有情感倾向,更多是用户对AI回答的感官体验。因此,挖掘AI的语言表达方式也具有积极的现实意义。继续利用WordCloud词云库生成可视化图像,将关键词出现频率映射为字体大小,辅助理解系统回答中关注的核心词汇与语言风格。
图4 Deepseek回答高频词(去停用词)词云
从图4词云图可以看出,系统回答中出现频率较高的关键词包括“需要”“可能”“用户”“希望”“提供”“通达”等,这些词汇反映出AI助手在回应用户问题时,倾向使用委婉、推测性和服务导向的语言风格。例如,“需要”“希望”体现出对用户需求的重视,而“可能”“或者”则体现出谨慎表达和灵活判断。这种语言风格既具备服务意识,也符合教育场景中语言表达的温和、鼓励性特点,有助于增强用户的接受度与信任感。
回答长度统计
对AI每条回答的词数(Token数量)进行统计,可以反映模型在内容生成时是否具备长文理解与生成能力,从而判断其回答是否满足不同复杂度问题的需求。
大部分AI助手的回答集中在500词以内,说明AI助手在处理日常问答时倾向于简洁、直接地给出回应。同时也存在部分回答超过1000词,甚至延伸至3000词以上,反映出系统在面对复杂问题时具备较强的信息组织和扩展能力。整体上,回答长度呈右偏分布,说明模型能根据问题复杂程度动态调整生成长度,具有良好的应答适配性。
结构性分析
结构性分析采用基于规则的文本特征识别方法,判断每条回答是否存在段落结构(如换行符、分点表达)与总结性语言(如“综上所述”“因此可见”等)。统计具备这两项特征的回答比例。分析表明,大约78%的回答具备段落结构,说明AI助手在多数回复中能较好地使用换行和层次组织内容,增强了文本的可读性。然而,仅有约43%的回答包含总结性语句,表明系统在提供全面内容时仍有提升空间,尤其在回答结尾处形成逻辑闭环的能力上尚不稳定,也可能较简易的问题就不需要累赘做总结。
从上述分析可以看出,师生使用平台提问活跃度较高,尤其关注海南相关话题、学术研究、师生、教育等具体内容,体现出学业发展与区域特色相结合的关切点。此外,通用性问题占比较小,平台对个性化需求的支持显得尤为重要。另外,AI助手的回答在情感表达、语言组织、长度控制等方面表现出较高水准,能够提供良好的用户交互体验。积极情绪占比显著,回答内容以问题解决为导向,整体具备逻辑清晰、实用性强的特点。但也存在如总结语句不足、个别情绪偏弱等可优化空间。建议未来结合用户提问意图,进行分场景的内容结构调整,引入总结模板与人性化表达机制,以进一步提升平台问答质量与服务精准度。
海南省高等学校教育教学改革研究项目(Hnjg2024ZD-19),海南省自然科学基金项目(625MS081),产学合作协同育人项目(CX2014141)
来源:《中国教育网络》2025年4月刊
作者:曹均阔1 吴宇欣1 汪上晋进1 陈国莲2(作者单位1为海南师范大学信息科学技术学院;2为海南师范大学国有资产管理处)
责编:陈荣