数据输出
OutputFormat作为MapReduce的数据输出,所有MapReduce输出都实现了OutputFormat接口,常用的有TextOutputFormat、SequenceFileOutputFormat等
TextOutputFormat
默认的输出格式是TextOutputFormat,它把每条记录写为文本行,键和值可以是任意类型,TextOutputFormat调用toString()方法把它们转换为字符串
SequenceFileOutputFormat
将SequenceFileOutputFormat输出作为后续 MapReduce任务的输入,它的格式紧凑,很容易被压缩
自定义
继承FileOutputFormat类,重写getRecordWriter方法,自定义RecordWriter类