网站首页 > 博客文章 正文
Apache POI 是一个流行的 Java 库,用于处理 Microsoft Office 文档,包括 Excel。处理大数据量的 Excel 文件时,建议使用 SXSSF (Streaming Usermodel API) 来写数据,因为它可以有效地处理大量数据而不会耗尽内存。
以下是一个简单的示例,展示如何使用 Apache POI 读写大数据量的 Excel 文件,并导出数据:
- 添加依赖
首先,确保你的项目中包含了 Apache POI 的依赖。如果你使用 Maven,可以在 pom.xml 中添加以下依赖:
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi-ooxml</artifactId>
<version>5.0.0</version> <!-- 请检查是否有更新的版本 -->
</dependency>
- 读取大数据量的 Excel 文件
public void readLargeExcelFile(String filePath) throws IOException {
InputStream is = new FileInputStream(filePath);
Workbook workbook = WorkbookFactory.create(is);
Sheet sheet = workbook.getSheetAt(0);
Iterator<Row> rowIterator = sheet.iterator();
while (rowIterator.hasNext()) {
Row row = rowIterator.next();
Iterator<Cell> cellIterator = row.cellIterator();
while (cellIterator.hasNext()) {
Cell cell = cellIterator.next();
switch (cell.getCellType()) {
case STRING:
System.out.print(cell.getStringCellValue() + "\t");
break;
case NUMERIC:
System.out.print(cell.getNumericCellValue() + "\t");
break;
// 其他数据类型可以按需处理
}
}
System.out.println("");
}
workbook.close();
is.close();
}
- 写入大数据量的 Excel 文件
使用 SXSSF 来处理大数据量的写入:
public void writeLargeExcelFile(String filePath) throws IOException {
Workbook workbook = new SXSSFWorkbook(); // 使用 SXSSF 处理大数据量写入
Sheet sheet = workbook.createSheet("Sheet1");
int rowCount = 0;
for (int i = 0; i < 100000; i++) { // 假设有100,000行数据
Row row = sheet.createRow(rowCount++);
for (int j = 0; j < 10; j++) { // 假设每行有10个单元格
Cell cell = row.createCell(j);
cell.setCellValue("Data" + i + j);
}
// 控制内存使用,告诉 SXSSF 在达到一定的行数后刷新到磁盘,释放内存中的行数据
if (rowCount % 100 == 0) {
((SXSSFSheet) sheet).flushRows(100); // 保留最后100行在内存中,其他的刷新到磁盘
}
}
FileOutputStream outputStream = new FileOutputStream(filePath);
workbook.write(outputStream);
workbook.close();
outputStream.close();
}
注意:当处理大数据量的 Excel 文件时,要确保调整 JVM 的内存设置,以提供足够的内存来处理数据。
猜你喜欢
- 2024-10-11 搞定Excel繁琐操作:一起轻松掌握EasyExcel的使用技巧
- 2024-10-11 「软件更新」MyExcel 3.0.0.RC 发布:重构&性能提升
- 2024-10-11 多功能 Excel 工具包 MyExcel(excel工具大全)
- 2024-10-11 Java使用poi进行excel的导入操作(java poi操作excel)
- 2024-10-11 SpringBoot实现Excel导入导出,好用到爆,POI可以扔掉了
- 2024-10-11 AI领域的“新常态”:面对“AI幻觉”,我们该怎么办?
- 2024-10-11 Java8如何让Excel的读写变得更加简单高效
- 2024-10-11 java使用导出百万级别数据?(java百万数据excel导入)
- 2024-10-11 高级Java研发师在解决大数据问题上的一些技巧
- 2024-10-11 Java POI实现300w条数据导出Excel
你 发表评论:
欢迎- 07-07Xiaomi Enters SUV Market with YU7 Launch, Targeting Tesla with Bold Pricing and High-Tech Features
- 07-07Black Sesame Maps Expansion Into Robotics With New Edge AI Strategy
- 07-07Wuhan's 'Black Tech' Powers China's Cross-Border Push with Niche Electronics and Scientific Firepower
- 07-07Maven 干货 全篇共:28232 字。预计阅读时间:110 分钟。建议收藏!
- 07-07IT运维必会的30个工具(it运维工具软件)
- 07-07开源项目有你需要的吗?(开源项目什么意思)
- 07-07自动化测试早就跑起来了,为什么测试管理还像在走路?
- 07-07Cursor 最强竞争对手来了,专治复杂大项目,免费一个月
- 最近发表
-
- Xiaomi Enters SUV Market with YU7 Launch, Targeting Tesla with Bold Pricing and High-Tech Features
- Black Sesame Maps Expansion Into Robotics With New Edge AI Strategy
- Wuhan's 'Black Tech' Powers China's Cross-Border Push with Niche Electronics and Scientific Firepower
- Maven 干货 全篇共:28232 字。预计阅读时间:110 分钟。建议收藏!
- IT运维必会的30个工具(it运维工具软件)
- 开源项目有你需要的吗?(开源项目什么意思)
- 自动化测试早就跑起来了,为什么测试管理还像在走路?
- Cursor 最强竞争对手来了,专治复杂大项目,免费一个月
- Cursor 太贵?这套「Cline+OpenRouter+Deepseek+Trae」组合拳更香
- 为什么没人真的用好RAG,坑都在哪里? 谈谈RAG技术架构的演进方向
- 标签列表
-
- ifneq (61)
- 字符串长度在线 (61)
- messagesource (56)
- aspose.pdf破解版 (56)
- promise.race (63)
- 2019cad序列号和密钥激活码 (62)
- window.performance (66)
- qt删除文件夹 (72)
- mysqlcaching_sha2_password (64)
- ubuntu升级gcc (58)
- nacos启动失败 (64)
- ssh-add (70)
- jwt漏洞 (58)
- macos14下载 (58)
- yarnnode (62)
- abstractqueuedsynchronizer (64)
- source~/.bashrc没有那个文件或目录 (65)
- springboot整合activiti工作流 (70)
- jmeter插件下载 (61)
- 抓包分析 (60)
- idea创建mavenweb项目 (65)
- vue回到顶部 (57)
- qcombobox样式表 (68)
- tomcatundertow (58)
- pastemac (61)
本文暂时没有评论,来添加一个吧(●'◡'●)