만약 실시간 로그수집 아키텍처를 다시 구축한다면 어떻게 설계하고 싶은지?

현재 실시간 로그수집 구축이 늦어지고 있다고 적혀있는데 이유가 무엇인지?

실시간 n명 시청중 뜨는거 구현한다고 했을 때, 어떤 방식으로 구현할 것인지?

만약 띄워놓은 kafka / kinesis가 내려가버리면 어떻게 대처할것인지?

spark vs mapreduce 차이점

HDFS vs 일반 파일시스템 차이점

redshfit와 달리 아테나는 왜 스캔한 용량만큼 비용을 지불하는가?

athena는 자기 서버가 없는데 어떻게 쿼리를 실행시키는가?