博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Atitit.论图片类型 垃圾文件的识别与清理 流程与设计原则 与api概要设计 v2 pbj...
阅读量:5929 次
发布时间:2019-06-19

本文共 2014 字,大约阅读时间需要 6 分钟。

Atitit.论图片类型 垃圾文件的识别与清理  流程与设计原则 与api概要设计 v2 pbj

 

 

1俩个问题::识别垃圾文件与清理策略1

2如何识别垃圾图片1

2.1. 体积过小文件<10kb1

2.2. 增加扩展名对于无扩展名文件1

2.3. 清理非图片(bmp,jpg,jpeg,png)的文件2

2.4. 尺寸过小图片(210*1502

2.5. 清理广告图片(高度宽度不成比例)超长超宽图片2

2.6. 清理重复图片(此结果不能加入指纹库)2

2.7. 非本类别的图片(人工识别)2

3垃圾图片文件指纹库3

3.1. 根据垃圾文件指纹库(模式结果固化)3

3.2. 根据垃圾文件路径名称库(加快性能比对速度,md5可能比较慢)3

4人工识别垃圾图片策略3

5清理策略3

6Code3

6.1. 文件去重4

 

 

 

1. 俩个问题::识别垃圾文件与清理策略

 

2. 如何识别垃圾图片

2.1. 体积过小文件<10kb

2.2. 增加扩展名对于无扩展名文件

package com.attilax.clr;

 

import com.attilax.clr.imp.MoveExcuter;

import com.attilax.clr.imp.NoPicReconer;

import com.attilax.clr.imp.tooMinSizePicClrerPartImp;

import com.attilax.clr.imp.tooMiniPixPicClrerPartImp;

 

public class ClrerPicClrer extends ClrerAbs {

 

 

public static void main(String[] args) {

ClrerPicClrer c=new ClrerPicClrer();

c.dir="d:\\ati\\isheo";

c.dir="D:\\ati\\p2015\\pic_p";

 

NoExtnameCheckerImp  neImp=new NoExtnameCheckerImp();

c.PreProcessor=neImp;

 

c.traveDir(c.dir);

System.out.println("--f");

2.3. 清理非图片(bmp,jpg,jpeg,png)的文件

Gif js 

2.4. 尺寸过小图片(210*150

2.5. 清理广告图片(高度宽度不成比例)超长超宽图片

长宽比大于2的图片

2.6. 清理重复图片(此结果不能加入指纹库)

部分重复文件是广告文件,所以容易重复

 

2.7. 非本类别的图片(人工识别)

作者:: 老哇的爪子 Attilax 艾龙,  EMAIL:1466519819@qq.com

转载请注明来源: http://www.cnblogs.com/attilax/

 

3. 垃圾图片文件指纹库

3.1. 根据垃圾文件指纹库(模式结果固化)

3.2. 根据垃圾文件路径名称库(加快性能比对速度,md5可能比较慢)

 

4. 人工识别垃圾图片策略

不好的isho

不能likepic

误删除的文件专门集中放在isho_manu文件夹中,人工处理

 

 

 

5. 清理策略

生成清理脚本(或者直接java程序模式)

移动到制定文件夹(推荐)

 

 

6. Code

AtibrowPrj

public class ClrerPicClrer extends ClrerAbs {

 

 

public static void main(String[] args) {

ClrerPicClrer c=new ClrerPicClrer();

c.dir="d:\\ati\\isheo";

//c.GabFileRecongers.add(new NoPicReconer());

tooMiniPixPicClrerPartImp ClrerPartImp = new tooMiniPixPicClrerPartImp();

ClrerPartImp.dir=c.dir;

ClrerPartImp.targetDir="d:\\ati\\tooMiniPixPic_files";

c.IClrerParts.add(ClrerPartImp);

tooMinSizePicClrerPartImp tmsc=new tooMinSizePicClrerPartImp();

tmsc.dir=c.dir;

tmsc.targetDir="d:/ati/tooMinSize_files";

c.IClrerParts.add(tmsc);

 

c.traveDir(c.dir);

System.out.println("--f");

}

 

 

 

6.1. 文件去重

DeduliAbs_ByMoveToNewFolder.java

 

 

 

你可能感兴趣的文章
picasso-强大的Android图片下载缓存库
查看>>
C# chart控件绘制曲线
查看>>
servlet中请求转发(forword)与重定向(sendredirect)的区别
查看>>
微信禁用右上角的分享按钮,WeixinJSBridge API以及隐藏分享的子按钮等菜单项
查看>>
多终端数据同步机制设计(二)
查看>>
史上最全最强SpringMVC详细示例实战教程【good】
查看>>
realloc,malloc,calloc函数的区别
查看>>
设计模式(二)代理模式
查看>>
基于ThinkPHP框架的简单的后台管理系统
查看>>
php页面防重复提交方法总结
查看>>
【linux】监控磁盘情况并自动删除备份文件
查看>>
约定优于配置
查看>>
Nodejs进阶:MD5入门介绍及crypto模块的应用
查看>>
redis 简单安装使用
查看>>
004-java类保存优化
查看>>
实现一个 WPF 版本的 ConnectedAnimation
查看>>
高阶类型(构造器):Kind (type theory)
查看>>
WindowsPhone7.1机器调试部署不成功的问题解决
查看>>
HTTP/1.1组块(chunked)传输编码实验
查看>>
Solex - Web Application Testing with Eclipse
查看>>