微信扫码
添加专属顾问
我要投稿
在kimi中输入提示词:
你是一个Python编程专家,完成如下Python脚本的编写:
读取"F:\AI.docx"这个文件;
然后用jieba分词对文件内容进行分词;
用wordcloud生成词云,背景颜色设为白色;
词云图片保存到F盘;
注意:每一步都要输出相关信息到屏幕上
指定使用Windows系统中的黑体字体 ,字体路径为:'C:\\Windows\\Fonts\\simsun.ttc'
为什么要指定字体呢?
如果不指定字体,词云中的英文显示正常,但是中文是乱码的。生成词云时中文显示为乱码通常是因为字体问题。wordcloud库默认使用的字体可能不支持中文字符,因此需要指定一个支持中文的字体。在Python中,一个常用的支持中文的字体是'SimHei'(黑体)。要解决这个问题,需要做两件事:指定中文字体:在创建WordCloud对象时,设置font_path参数为一个支持中文的字体路径。安装中文字体:如果你的系统中没有安装支持中文的字体,你需要先安装一个。
Kim生成的Python源代码:
import os
from docx import Document
from wordcloud import WordCloud
import jieba
from PIL import Image
import numpy as np
# 设置文件路径和字体路径
docx_path = 'F:\\AI.docx'
output_image_path = 'F:\\wordcloud.png'
font_path = 'C:\\Windows\\Fonts\\simsun.ttc' # 指定Windows系统中的黑体字体路径
# 检查文件是否存在
if not os.path.isfile(docx_path):
print(f'文件 {docx_path} 不存在。')
else:
# 读取Word文档
doc = Document(docx_path)
text = " ".join([para.text for para in doc.paragraphs])
print('文件读取成功。')
# 使用jieba进行中文分词
words = " ".join(jieba.cut(text, cut_all=False))
print('分词完成。')
# 生成词云
wordcloud = WordCloud(
font_path=font_path, # 指定中文字体路径
background_color='white',
max_words=200,
max_font_size=100,
random_state=42,
width=800,
height=400,
colormap='viridis'
).generate(words)
# 保存词云图片
wordcloud.to_file(output_image_path)
print(f'词云图片已保存到 {output_image_path}')
# 显示词云图片
image = Image.open(output_image_path)
image.show()
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-09-15
别再误会MCP了!一篇写给AI工程师的硬核“辟谣”指南
2025-09-14
为什么说阿里巴巴正转身“AI科技公司”
2025-09-14
阿里云赢 AI 云的真相:不是模型比人强,是把 “用 AI 的门槛” 拆成了 “可复制的效率”
2025-09-14
一万两千字,解读智能应用开发最佳实践
2025-09-14
AI 新玩法:GraphRAG × Ollama 打造更聪明的智能体
2025-09-14
阿里云视觉多模态理解大模型开发训练部署
2025-09-14
2025.9 回顾过去1年的LLM圈进展 与 展望
2025-09-14
抢先实测美团首个AI Agent,让我体验一把「懒人点餐」的快乐
2025-08-21
2025-06-21
2025-08-21
2025-08-19
2025-06-19
2025-07-29
2025-09-08
2025-08-19
2025-08-20
2025-07-04
2025-09-14
2025-09-12
2025-09-11
2025-09-11
2025-09-09
2025-09-09
2025-09-08
2025-09-08