네이버 카페 모니터링을 자동화했다
업무상 네이버 카페 몇 곳에서 특정 키워드가 언급되는 글을 추적해야 했다. 대상 카페가 4곳이고, 추적하는 키워드가 6개인데, 카페 회원들은 이름을 직접 안 쓰고 초성이나 줄임말을 쓰는 경우가 많다. 그래서 추적해야 하는 표현의 가짓수가 꽤 많았다.
이걸 매일 수동으로 했다. 카페 4곳에 키워드 6개면 하루에 검색만 20번이 넘는데, 새 글이 올라왔는지 하루에도 몇 번씩 확인해야 하니까 실제로는 훨씬 더 많은 시간을 쓰고 있었다. 솔직히 매번 똑같은 검색어를 치고 있으면 "이걸 왜 내가 하고 있지?"라는 생각이 든다.
RSS는 네이버 카페가 지원을 안 해서 바로 탈락이고, 웹 스크래핑은 로그인 벽이랑 Cloudflare 때문에 유지보수가 끔찍할 게 뻔했다. 결국 네이버가 공식으로 제공하는 검색 API를 쓰기로 했다. 카페 게시글을 키워드로 검색할 수 있고, 공식이라 갑자기 막힐 걱정도 없다.
5분마다 자동으로 검색을 돌리고, 이미 본 글인지 확인한 다음, 새 글만 골라서 Slack으로 보내주는 구조다. 같은 글이 여러 키워드에 걸리면 알림을 하나로 합쳐서 보내니까 채널이 도배되지도 않는다.
이제 아침에 Slack을 열면 밤사이 올라온 관련 글이 정리되어 있다. 카페 돌아다니면서 검색하던 그 시간이 완전히 사라졌다. 운영 비용은 0원이다. 전부 무료 티어로 돌아간다.
돌이켜 보면 이 작업에서 제일 중요했던 건 기술 선택이 아니라 문제를 좁히는 거였다. 처음에는 "카페 모니터링 자동화"라고 막연하게 생각했는데, 실제로 필요한 건 "새 글이 올라왔을 때 알려주는 것"이지, 게시글 전문을 수집하거나 분석하는 게 아니었다. 문제를 좁히니까 솔루션도 간단해졌다.