报错 下标越界

来源:12-12 -使用Spark Streaming完成数据清洗操作

人唯优2018

2018-08-24

在kafka对接streaming 使用producer 进行测试的时候,若生产者输入referer为空的一条日志就正常,可以正常解析

//img.mukewang.com/szimg/5b7f70e800012faa07020160.jpg

若在生产端输入带网址的:128.187.36.27 2018-08-21 22:47:59 "GET /class/128.html HTTP/1.1" 200 https://search.yahoo.com/search?p=hadoop 基础,就报错,

//img.mukewang.com/szimg/5b7f71a60001774714760412.jpg

对应的报错代码是 这里

//img.mukewang.com/szimg/5b7f721c0001c5c807790211.jpg

测试了,没找到原因

同样的代码内容,同样的测试log,用RDD就能解析出来,放到streaming里测试就是下标越界

http://img.mukewang.com/szimg/5b7f79b70001080017890195.jpg

写回答

1回答

Michael_PK

2018-08-24

数组下标越界了!!!  很简单,你把生产的这个完整信息,拷贝出来,写个测试类解析下,肯定是字符串截取的有问题

0
3
Michael_PK
回复
人唯优2018
细节决定成败,哈哈
2018-08-24
共3条回复

Spark Streaming实时流处理项目实战

Flume+Kafka+Spark Streaming 构建通用实时流处理平台

1404 学习 · 571 问题

查看课程