안녕하세요. 오토소장 김효복입니다. 요 며칠 무더운 더위와 잦은 폭우로 날씨가 정말 변덕스러웠는데요. 이 와중에 지독한 감기에 걸려 약 일주일은 앓아누워있었네요. 이제는 어느 정도 회복되어 이번 주에 발행할 칼럼을 늦게나마 마무리 해봅니다.

 이번 칼럼에서는 국세청 홈택스의 사업자등록 상태 조회 및 세무자료(전자세금계산서, 현금영수증, 신용카드 등)를 자동으로 수집하는 다양한 방법들에 대해서 정리해보았습니다. 이번 칼럼을 통해 세무자료를 수집하는 다양한 방법들에 대한 인사이트를 얻을 수 있을 것으로 기대합니다.

국세청 홈택스란?

국세청 홈텍스 로고

그림. 국세청 홈텍스 로고 (출처:국세청)

 국세청 홈택스는 개인과 기업의 세무 신고를 편리하게 할 수 있도록 정부에서 제공하는 온라인 서비스입니다.

 국세청 홈택스에서는 연말정산, 종합소득세 신고, 부가가치세 신고 등 다양한 세무 신고를 할 수 있으며, 종합소득세 대리 신고를 위해 사업자별 부가가치세, 기타소득 신고 내역, 연금건강 고용산재보험료 등을 조회하고 출력할 수 있습니다. 특히 세무사나 회계사가 운영하는 세무회계사무소의 직원분들이 개인사업자 고객들의 세무자료를 획득하고 세무대리 신고하기 위해 국세청 홈택스를 많이 이용합니다.

 매년 5월은 전년도 종합소득세 신고 기간으로 지정되어 있는데요. 이 기간에는 많은 세무회계사무소의 직원분들이 세무대리신고로 인해 늦은 시간까지 많은 업무를 하고 있습니다. 그중에 가장 많은 업무를 차지하는 것이 사업자별 세무자료를 수집하고 정리하는 업무입니다.

 세무사의 공인인증서를 통해 국세청 홈택스에 로그인하여 사업자 정보(주민번호 또는 사업자 번호)를 입력하고 각종 세무자료를 조회하고 출력하여 정리해야 합니다. 사업자 고객이 100명이면 100번을 비슷한 패턴으로 반복해서 자료를 수집해야 합니다. 이러한 어려움으로 인해 업무 자동화 기술을 이용하여 국세청 홈택스의 세무자료들을 자동으로 수집하고 정리할 필요가 있습니다.

세무자료 수집 자동화 방법 2가지

웹 스크래핑 방식

 개인 또는 기업에서 국세청 홈택스의 세무자료를 자동으로 수집하기 위해 웹 스크래핑 기법을 많이 사용합니다. 웹 스크래핑 방식의 자동화된 공인인증서 로그인을 통해 사업자별 세무자료를 추출 및 수집하여 세무대리신고에 활용할 수 있기 때문입니다.

 웹 스크래핑 방식의 한계점은 자동화된 응용 프로그램이 구글 크롬과 같은 웹 브라우저 프로그램과 서로 상호작용하여 동작하는 방식입니다. 사람이 아닌 프로그램에 의해 수행되기 때문에 데이터를 식별하고 추출/수집하는 속도가 사람보다 훨씬 빠르게 작업이 가능한 반면에 그만큼 국세청 서버에 과부하를 발생시킬 수 있습니다. 사용자가 가장 많이 몰리는 5월 종합소득세 신고 기간 중에는 국세청에서 사용자의 홈택스 이용 장애 최소화를 위해 웹 스크래핑 기능을 차단 시킬 수도 있습니다.

 또한 국세청 홈택스에서 자동화된 공인인증서 로그인을 위해 PKI1 및 보안 프로그램이 사전에 설치되어 있어야 합니다. 이러한 보안 프로그램으로 인해 자동화 프로그램의 스크린 캡처나 키보드/마우스 입력에 제약이 발생할 수 있습니다. 공인인증서의 구조 분석을 통한 자동 로그인 개발 시 기술적 난이도가 높으므로 개발 비용이 높게 산출될 수도 있습니다. 그만큼 공인인증서를 통한 자동 로그인 기능은 보안에 대한 지식이 있어야 하므로 기술적인 진입장벽이 높습니다.

 자동화된 공인인증서 로그인이 완료되면 연말정산, 종합소득세 신고, 부가가치세 신고 등 다양한 세무자료를 자유롭게 조회하고 출력할 수 있습니다.

오픈 API 방식

 오픈 API의 정의는 다음과 같습니다.

오픈 API(Open Application Programming Interface, Open API)는 누구나 사용할 수 있도록 공개된 API를 말한다. 쉽게 말하면, 하나의 웹 사이트에서 자신이 가진 기능을 외부에서 이용할 수 있도록 공개한 프로그래밍 인터페이스가 오픈 API다 라고 정의할 수 있다. –위키백과

 행정안전부(이하, 행안부)에서 운영하는 공공데이터 포털에서는 연계된 여러 기관의 데이터를 개방하고 있습니다. 공공데이터 포털에서 데이터를 제공하는 방법은 크게 파일 데이터오픈 API 두 가지입니다. 파일 데이터는 CSV2 파일 형태로 제공하고 있으며, 오픈 API는 SOAP(Simple Object Access Protocol)3 또는 REST(Representational State Transfer)4 API로 제공하고 있습니다.

공공데이터포털 연계 기관

그림. 공공데이터포털 연계 기관 (출처:공공데이터포털)

 공공데이터 포털에서는 국세청의 일부 데이터만 오픈 API로 제공하고 있습니다. 바로 사업자등록정보 진위 확인 및 상태 조회 서비스 인데요. 이 데이터는 오픈 API의 REST로 데이터를 요청하고 받을 수 있습니다[1]. 다른 정보에 비해 사업자등록정보에 대한 수요가 많아서 우선적으로 서비스하고 있는 게 아닌가 추측하고 있습니다.

 공공데이터를 활용하는 절차는 다음과 같습니다.

  • 1단계 : 오픈 API 선택
  • 2단계 : 오픈 API 활용신청
  • 3단계 : 오픈 API 활용승인
  • 4단계 : 오픈 API 인증키 발급

정리하며

 이번 시간에는 국세청 세무자료를 자동으로 수집할 수 있는 2가지 방법에 대해서 알아보았습니다. 하나의 칼럼에서 다루기에는 분량이 너무 많아져서 어려운 기술적인 내용은 최대한 제외하였는데요, 관련 기술에 대한 내용들은 차후에 한 번 더 심도 있게 다루어 보도록 하겠습니다.

참고자료

[1] 국세청_사업자등록정보 진위확인 및 상태조회 서비스 – 공공데이터포털(행안부)

각주

1. PKI(Public Key Infrastructure)는 트랜잭션에 관련된 당사자들을 인증하기 위해 공개 키 암호화의 사용을 지원하는 기능, 정책 및 서비스의 시스템이다.
2. CSV 파일은 데이터를 구조화된 표 형식으로 저장할 수 있는 특정 형식의 텍스트 파일이다.
3. SOAP(Simple Object Access Protocol)은 일반적으로 널리 알려진 HTTP, HTTPS, SMTP 등을 통해 XML 기반의 메시지를 컴퓨터 네트워크 상에서 교환하는 프로토콜이다.
4. REST는 월드 와이드 웹과 같은 분산 하이퍼미디어 시스템을 위한 소프트웨어 아키텍처의 한 형식이다.


본 칼럼 내용에 대해 문의 하실 사항이나 필요하신 칼럼 주제가 있으시면 언제든지 댓글로 알려주세요.