neilzhu 1830194db8 first commit 1 month ago
..
README.md 1830194db8 first commit 1 month ago
generate_all_sourcecode.py 1830194db8 first commit 1 month ago
generate_all_sourcecode.sh 1830194db8 first commit 1 month ago
generate_backend_sourcecode.py 1830194db8 first commit 1 month ago
generate_backend_sourcecode.sh 1830194db8 first commit 1 month ago
generate_frontend_sourcecode.py 1830194db8 first commit 1 month ago
generate_frontend_sourcecode.sh 1830194db8 first commit 1 month ago
merge_all_simple.py 1830194db8 first commit 1 month ago
merge_all_simple.sh 1830194db8 first commit 1 month ago
merge_backend_simple.py 1830194db8 first commit 1 month ago
merge_backend_simple.sh 1830194db8 first commit 1 month ago
merge_database_simple.py 1830194db8 first commit 1 month ago
merge_database_simple.sh 1830194db8 first commit 1 month ago
merge_frontend_simple.py 1830194db8 first commit 1 month ago
merge_frontend_simple.sh 1830194db8 first commit 1 month ago

README.md

源代码生成与拼接脚本说明文档

📖 脚本概览

本目录包含两类脚本:源代码生成脚本源代码拼接脚本,它们服务于不同的使用场景和目的。

🎯 脚本分类与对比

📂 源代码生成脚本 (原有脚本)

前端源代码生成

  • Python版本: generate_frontend_sourcecode.py
  • Shell版本: generate_frontend_sourcecode.sh

核心特性

  • ✂️ CSS内容清理 - 移除<style>标签、CSS外链、内联样式
  • 🎯 内容优化 - 突出HTML结构和JavaScript逻辑
  • 📊 智能分批 - Python版本支持按token限制分批输出
  • 🤖 AI友好 - 清理后的内容更适合AI分析和处理

适用场景

  • 与AI助手交互,分析页面结构
  • 代码审查和逻辑分析
  • 需要突出程序逻辑的技术讨论

后端源代码生成

  • Python版本: generate_backend_sourcecode.py
  • Shell版本: generate_backend_sourcecode.sh

核心特性

  • 🔍 智能文件检测 - 自动识别Python、配置等文件
  • 📋 分类处理 - 按文件类型组织内容
  • 🗂️ 结构化输出 - 清晰的文件分隔和说明

全量源代码生成

  • Python版本: generate_all_sourcecode.py
  • Shell版本: generate_all_sourcecode.sh

核心特性

  • 🚀 一键执行 - 批量调用前端和后端生成脚本
  • 📊 统计报告 - 提供生成结果统计
  • 🔄 流程管理 - 按序执行各个生成步骤

📁 源代码拼接脚本 (专用于软著申请)

模块化拼接脚本

  • 前端拼接: merge_frontend_simple.sh - 拼接 output_sourcecode/front/ 下的HTML文件
  • 后端拼接: merge_backend_simple.sh - 拼接 output_sourcecode/backend/ 下的源代码
  • 数据库拼接: merge_database_simple.sh - 拼接 output_sourcecode/db/ 下的SQL文件

统一入口脚本

  • 智能拼接器: merge_all_simple.sh - 提供分类拼接和全量拼接两种模式的交互式选择

核心特性

  • 📄 完整保留 - 保持源代码100%原貌,无任何删减
  • 🎯 软著专用 - 专为软件著作权申请材料设计
  • 极简高效 - 纯文本拼接,执行速度快
  • 📋 单文件输出 - 便于提交和归档
  • 🌐 多技术栈支持 - Java、Python、C#、Node.js、PHP、Go等主流后端技术
  • 🔧 智能注释 - 根据文件类型自动选择合适的注释格式

适用场景

  • 软件著作权申请材料准备
  • 完整源代码归档和备份
  • 政府部门或第三方机构提交
  • 需要展示完整技术实现的场景

🔍 关键差异对比

核心区别

  • 生成脚本: 用于AI交互和代码分析,可有描述性输出
  • 拼接脚本: 专用于软著申请,必须严格纯代码输出
  • 系统提示词: 已明确指向拼接脚本进行软著材料生成

内容处理差异

特性 源代码生成脚本 源代码拼接脚本
CSS处理 ✂️ 移除CSS样式、外链、内联样式 📄 保持HTML完整原貌
内容完整性 🎯 优化处理,突出逻辑 📋 100%保留原始内容
文件分隔格式 === filename === /* ================= filename ================= */
压缩处理 📊 支持多级压缩选项 ❌ 无任何压缩处理
输出纯净度 🔍 包含统计和分析信息 📋 严格纯代码输出

输出格式差异

特性 源代码生成脚本 源代码拼接脚本
分批策略 📊 智能分批(Python版本) 📄 统一单文件
文件命名 前端源代码_part1.txt 前端源代码.txt
头部信息 🔍 包含分析和统计信息 📋 包含文件列表和时间戳
注释风格 🎯 根据优化需求调整 📝 根据文件类型选择

使用场景差异

场景 源代码生成脚本 源代码拼接脚本 推荐选择
AI对话分析 ✅ 清理后便于分析 ❌ 原始内容可能冗余 生成脚本
软著申请 ❌ 内容不完整 ✅ 符合官方要求 拼接脚本
代码审查 ✅ 突出核心逻辑 ✅ 查看完整实现 根据需求选择
技术交流 ✅ 便于理解和讨论 ❌ 包含过多样式信息 生成脚本
归档备份 ❌ 信息有损失 ✅ 完整保存 拼接脚本

📂 当前目录结构

output_sourcecode/
├── front/              # 前端HTML页面文件
├── backend/            # 后端源代码文件  
└── db/                 # 数据库SQL文件 ⭐ 新增

🚀 使用指南

快速选择指南

👨‍💻 我要与AI助手分析代码

# 使用源代码生成脚本(清理优化版本)
./generate_frontend_sourcecode.py
./generate_backend_sourcecode.py

📋 我要准备软著申请材料

# 使用源代码拼接脚本(完整原始版本)
./merge_all_simple.sh  # 一键生成所有材料
# 或单独执行
./merge_frontend_simple.sh     # 拼接 output_sourcecode/front/ 下的HTML文件
./merge_backend_simple.sh      # 拼接 output_sourcecode/backend/ 下的源代码
./merge_database_simple.sh     # 拼接 output_sourcecode/db/ 下的SQL文件

⚠️ 重要提醒:系统提示词中已明确指向拼接脚本用于软著申请材料生成

🔍 我要代码审查

# 逻辑分析用生成脚本,完整查看用拼接脚本
./generate_frontend_sourcecode.sh   # 突出核心逻辑
./merge_frontend_simple.sh          # 查看完整实现

执行顺序建议

软著申请材料准备流程

# 1. 确保已生成源代码文件
ls output_sourcecode/front/    # 前端HTML文件
ls output_sourcecode/backend/  # 后端源代码文件
ls output_sourcecode/db/       # 数据库SQL文件

# 2. 一键生成所有拼接材料(智能选择)
./merge_all_simple.sh
# → 选择1:分类拼接(3个独立文件)
# → 选择2:全量拼接(1个完整文件)

# 3. 检查生成的文件
ls -la ../../output_docs/

AI辅助开发流程

# 1. 生成优化版本用于AI分析
./generate_all_sourcecode.py

# 2. 根据AI建议修改源代码

# 3. 重新生成并继续迭代

📊 性能和资源消耗

Token消耗对比

操作 Token消耗 说明
脚本执行 0 token 所有脚本都是本地文本处理
用户使用生成结果与AI对话 根据内容量 取决于生成文件的大小
直接提交软著申请 0 token 无需AI处理

文件大小对比

基于典型10页面项目的估算:

脚本类型 输出文件大小 说明
生成脚本(清理CSS) ~50-80KB 移除样式后显著减小
拼接脚本(完整内容) ~200-500KB 保持原始完整内容

🛠️ 维护和扩展

添加新的拼接类型

  1. 参考现有merge_*_simple.sh模板
  2. 修改文件扩展名和查找路径
  3. 调整注释格式和输出命名
  4. 更新merge_all_simple.sh批量脚本

添加新的生成功能

  1. 参考现有generate_*.py模板
  2. 实现特定的内容处理逻辑
  3. 添加智能分批和压缩选项
  4. 更新generate_all_sourcecode.py统一入口

📋 支持的文件类型列表

后端源代码拼接脚本支持的文件类型

技术栈 文件类型 注释格式 说明
Java .java, .jsp, .xml //<!----> Spring Boot、JSP、Maven配置
Python .py # Python应用和脚本
C#/.NET .cs, .csproj, .sln //<!----> .NET应用和项目文件
Node.js .js, .ts, .mjs // JavaScript/TypeScript应用
PHP .php // PHP Web应用
Go .go, .mod // Go应用和模块文件
配置文件 .json, .yml, .yaml, .properties //# 应用配置
构建文件 pom.xml, package.json, requirements.txt 根据类型 构建和依赖管理
部署文件 Dockerfile, docker-compose.yml # 容器化部署
其他 .txt, .md, .cfg, .ini, .conf, .env # 文档和配置

前端拼接脚本支持的文件类型

文件类型 注释格式 说明
.html <!----> HTML页面文件
.css /* */ 样式表文件
.js, .ts, .mjs /* */ JavaScript/TypeScript文件

数据库拼接脚本支持的文件类型

文件类型 注释格式 说明 位置
.sql -- SQL表结构、数据定义 output_sourcecode/db/
.ddl -- 数据定义语言文件 output_sourcecode/db/
*schema*, *database* -- 数据库架构文件 output_sourcecode/db/

推荐文件命名

  • database_schema.sql - 主表结构定义
  • init_data.sql - 初始化数据
  • indexes.sql - 索引定义

📝 总结

两套脚本形成了完整的源代码处理工具链:

  • 源代码生成脚本 - 专注于内容优化,服务于AI交互和代码分析
  • 源代码拼接脚本 - 专注于完整保留,服务于软著申请和正式提交

根据具体使用场景选择合适的脚本,可以大大提高工作效率和输出质量。


更新时间: 2025-06-25 版本: v1.0
维护者: AI-Copyright-Application-Generator 项目组