0%

数据输出

数据输出

OutputFormat作为MapReduce的数据输出,所有实现MapReduce输出都实现了OutputFormat接口,常用的有TextOutputFormat、SequenceFileOutputFormat等

TextOutputFormat

默认的输出格式是TextOutputFormat,它把每条记录写为文本行,键和值可以是任意类型,TextOutputFormat调用toString()方法把它们转换为字符串

SequenceFileOutputFormat

将SequenceFileOutputFormat输出作为后续 MapReduce任务的输入,它的格式紧凑,很容易被压缩

自定义

继承FileOutputFormat类,重写getRecordWriter方法,自定义RecordWriter类