Caffe是一个开源的深度学习框架,它由伯克利人工智能研究实验室(BAIR)开发。最初Caffe专注于图像识别和计算机视觉任务,但现在也可用于其他领域,如语音识别和自然语言处理。Caffe Windows是针对Windows操作系统的Caffe版本。它提供了完整的Caffe开发环境和工具链,适用于Windows平台。其中包括预编译的Caffe二进制文件、CMake构建系统以及Python接口等。通过使用Caffe Windows,用户可以方便地在Windows操作系统上进行深度学习模型的训练和部署。
软件介绍
caffe支持cpu和gpu的无缝切换,这一点在现在的大数据时代显得尤为重要。但是对于我们这些正常人来说,如果让我们在gpu上进行编程,恐怕都要傻眼了,这时caffe就提供了一个便捷的方式,可以让你忽略cpu和gpu的差别,仅仅一个参数就可以让你的模型在cpu和gpu之间自由切换,大大提升了各位童鞋‘发论文’的速度。(还有一个python工具包也可以让你方便的在cpu和gpu之间进行切换,那就是Theano了,本人最初正是因为只有python工具包才有支持gpu编程的功能,所以才弃matlab从python的)软件特色
Caffe的设计考虑了以下几个方面:1、表示:模型和优化以纯文本的模式定义,而不是以代码模式;
2、速度:运算速度对于最先进模型和海量数据是至关重要的;
3、模块化:新的任务和配置要求框架具有灵活性和扩展性;
4、开放性:科研和应用过程需要公共的代码、可参考的模型和可再现性;
5、社区:通过共同讨论和具体协议共同开发这个项目,学术研究、起步阶段的原型和工业应用可以共享各自的力量。
拥有以上诸多优势,经过两年多的版本迭代,Caffe框架已经在学术界和工业界得到了广泛的认可。
那么是什么原因促使caffe的运行速度比其它深度学习框架的运行速度快呢?
个人认为有以下几点:
1、数据存储:
Caffe生成的数据分为2种格式:
Lmdb和Leveldb
它们都是键/值对嵌入式数据库管理系统编程库。
虽然lmdb的内存消耗是leveldb的1.1倍,但是lmdb的速度比leveldb快10%至15%,更重要的是lmdb允许多种训练模型同时读取同一组数据集。
因此lmdb取代了leveldb成为Caffe默认的数据集生成格式。(这点得吐槽下了,没空的自行跳过此段。
之前用的是实验室服务器上安装的老版本的caffe,在运行MNIST和CIFAR-10的例子时,caffe官网教程上的还是生成*_leveldb格式的数据,但当我几天后跑ImageNet实例时,提示我找不到$CAFFE_ROOT/build/tools/目录下的caffe文件,后来还是通过和网友的tools目录下的文件对比才发现,编译后生成的老版本的caffe比新版的少了一堆东西,只好重新编译新版本,编译过程中发现缺少lmdb,查资料才发现,caffe已经用lmdb取代了leveldb,而返回去看之前的MNIST和CIFAR-10实例教程,发现教程上也已经将leveldb的部分改成lmdb了。还是提醒各位及时升级,有问题多看几遍官网教程)
2、数据传输:
当数据在前向后向传输时,caffe采用blobs的形式对数据进行传递或处理,它是该框架采用的标准的存储接口。
下面是百度百科上对blob的一段解释:
BLOB (binary large object),二进制大对象,是一个可以存储二进制文件的容器。在计算机中,BLOB常常是数据库中用来存储二进制文件的字段类型。
BLOB是一个大文件,典型的BLOB是一张图片或一个声音文件,由于它们的尺寸,必须使用特殊的方式来处理(例如:上传、下载或者存放到一个数据库,caffe中的lmdb或leveldb)
在caffe中,blob是一个四位数组,不过在不同的场合,各维表示的意义不同
对于数据:Number*Channel*Height*Width
对于卷积权重:Output*Input*Height*Width
对于卷积偏置:Output*1*1*1