Skip to main content

Principal, Data Scientist (Catalog Science)

Seoul, South Korea

1674946 May. 07, 2019 Platform, Search and Discovery

 

쿠팡은  세계에서  가장  빠르고  크게  성장하는  Ecommerce  기업 입니다.  우리는 고객, 직원, 파트너 그리고 우리를 둘러싼 모든 사람들의 일상을 어떻게 혁신 할 수 있을 지 매 순간 고민합니다. 우리는 아직 아무도 풀지 못한 문제를 해결함으로써 사람들이 이렇게 묻는 세상을 만들고자 합니다. “쿠팡 없이 어떻게 살았을까?” 쿠팡은 서울뿐만 아니라 베이징, LA, 시애틀, 상하이와 실리콘밸리 등에 오피스를 두고 있는 글로벌 기업입니다. 

 

직무 소개: 

우리의 목표는 고객을 위해 최고의 이커머스 경험을 제공하는 것입니다. 수 백만개에 달하는 셀러 상품을 대상으로 상품 카탈로그(Catalog)의 특징을 자동 인식하고 정보의 구조화를 통해 카탈로그 품질을 높여 일관적인 고객 경험을 전달하고자 합니다. 머신 러닝을 기반으로 만든 모델을 활용해 텍스트에서 유실된 데이터를 추출하고, 부정확한 정보를 선별하여 자동으로 수정합니다. 효율적인 work flow 를 통해 사람의 판단은 필요한 경우에만 적용해도 충분하도록 만들고자 합니다.

우리는 매일 휴대폰 케이스, 패션 등 다양한 상품 카테고리와 관련된 문제를 해결하고, 카탈로그(Catalog), 고객상품평, 클릭(View) 등 다양한 데이터 소스를 활용하여 카탈로그를 끊임없이 향상시킵니다.

쿠팡의 Data Scientist는 보유한 지식을 활용하여 텍스트 이해(NLP/정보 추출) 자동화를 위한 알고리즘 및 견고하고 확장 가능하며 유지보수가 용이한 머신 러닝 모델을 만듭니다. 또한 문제 해결에 있어 엄격하게 과학적으로 접근하고, 카탈로그 전략 전반에 대해 비즈니스 조직과 개발팀에 중요 의견을 제공합니다. 쿠팡의 톱 클래스 엔지니어와의 협업을 통해 운영 시스템에 솔루션을 제공하여 고객의 쇼핑 경험에 변화를 만들 수 있습니다.

 

업무 내용:

  • 신규 알고리즘 및 기법의 설계, 테스트를 통해 비구조화 데이터에서 상품 데이터를 추출하여 상품 발견성(Product Discovery) 개선
  • 대규모 데이터를 분석하여 패턴을 도출하고 견고한 모델을 정립해 다양한 소스에서(예: Product Catalog, Customer Review, clicks 등) 가치있는 정보 추출
  • 높은 정확도로 고객용 카테고리에 상품 자동 분류
  • 브랜드, 사이즈, 색상 등 속성의 여러 변형 형태(언어 및 철자의 차이)를 정규화
  • 수백만 신규 유입 상품 중 동일하거나 유사한 상품 선별
  • 온라인 판매 금지된 불법 상품 선별
  • 고객 경험에 중요한 상품 정보 정의
  • 위의 알고리즘 및 기법을 적용하여 고객이 접하는 웹사이트 정보를 개선, 다양한 문제 자동 해결 및 카탈로그 전문가의 식견이 필요한 사례 선별
  • 고품질 상품 데이터 제공, 상품의 발견성(Product Discovery) 제고 및 입점 업체의 사업성 개선을 통해 웹사이트상 고객 경험 개선에 기여

 

자격 요건:

  • 컴퓨터학(Machine learning, Data mining, Information retrieval), 통계학 또는 관련 분야 석사 학위
  • Machine learning, Data mining, Big Data 분야 경력 2년 이상
  • R/Python 실무 지식
  • Spark/MapReduce/Hadoop 등 분산형 프레임워크 경력
  • 독창적 해결책과 뛰어난 문제 해결 능력
  • 비공식 비즈니스 문제를 Problem statement로 기술하고 솔루션을 도출하는 능력

 

우대

  • 컴퓨터학(Machine learning, Data mining, NLP, Information retrieval), Statistics 또는 관련 분야 박사 학위 소지
  • Machine learning, Data mining 또는 Statistics 분야 저술 실적 및 검증된 실제 적용 경험
  • Junior Engineer 및 Data Scientist들을 이끌어가고자 하는 의지
  • 뛰어난 구두 및 서면 커뮤니케이션 스킬

 

전형 절차 및 기타사항  

  1. 전형절차: 서류전형 - 전화면접 - 대면면접 - 최종합격  (전형절차는 직무별로 다르게 운영될 수 있으며, 일정 및 상황에 따라 변동될 수 있습니다.) 
  2. 기타사항:

a. 본 공고는 모집 완료 시 조기마감 될 수 있습니다.  

b. 지원서 내용 중 허위사실이 있는 경우에는 합격이 취소될 수 있습니다. 

c. 보훈대상자 및 장애인 여부는 채용과정에서 어떠한 불이익도 미치지 않습니다. 

d. 전형일정 및 결과는 지원서에 등록하신 이메일로 개별 안내 드립니다.  

 

채용 담당자: 오지나 (jinaoh@coupang.com)

 

Coupang is one of the largest and fastest growing e-commerce platforms on the planet. We are on a mission to revolutionize everyday lives for our customers, employees and partners. We solve problems no one has solved before to create a world where people ask, “How did we ever live without Coupang?” Coupang is a global company with offices in Beijing, Los Angeles, Seattle, Seoul, Shanghai, and Silicon Valley. 

Job Overview:

Our goal is to build the best e-commerce experience for our customers. We get millions of products from sellers and we want to build a consistent experience by automatically detecting features from catalog, and enriching the catalog with structured information. We use machine learning to develop models to extract missing data from text, detect inaccuracies and fix them automatically. We strive to build efficient workflows allowing humans to apply their judgment only when necessary.

On a daily basis, we solve problems from different kinds product categories ranging from cell phone cases to fashion, consume various sources of data such as catalog, reviews, views etc. to continually enhance the catalog. And we do all of this at scale that is growing at a rapid pace.

As a data scientist you will use your knowledge to build algorithms that help us with automatic understanding of text (NLP/Information extraction), and robust scalable and maintainable machine learning models. You will bring scientific rigour to problem-solving and provide key inputs to business and engineering teams on overall strategy for catalog. You will work with our top engineers to put your solutions into production systems that impact how our customers shop.

Key Responsibilities:

  • Extract product data from unstructured data by designing and testing new algorithms and techniques, thereby improving discovery of products.
  • Analyze large amounts of data to discover patterns and build robust models to extract valuable information from various sources (e.g. product catalog, customer reviews, clicks etc.) that vary in quality of data and structure.
  • Automatically classify products into customer facing category with high accuracy.
  • Normalize variations (by language and spelling) for attributes like as brand, size or color.
  • Identify products that are identical or similar from millions of incoming selection of products.
  • Identify illegal products that are not allowed on the website.
  • Define product information that is important for customer experience.
  • You will put such algorithms and techniques to improve what customer sees on website, resolving many use cases automatically and identify cases that need inputs from catalog experts.
  • You will help improve customer experience on the website by enabling them to see high-quality data for products, discover items that are not otherwise visible and help merchants to improve their business.

Qualifications: 

  • Masters degree in Computer Science (Machine learning, Data mining, NLP, Information retrieval), Statistics or related field
  • 2+ years of experience in machine learning, data mining, big data
  • Good working knowledge of R/Python
  • Experience with distributed frameworks like Spark/MapReduce/Hadoop
  • Excellent problem-solving skills with out of box solutions
  • Ability to decompose informal business problems into problem statements and build solutions

Preferred: 

  • Ph.D degree in Computer Science (Machine learning, data mining, information retrieval), Statistics or related field
  • Proven practical experience in machine learning, data mining or statistics with track record of publications
  • Desire to guide junior engineers and data scientists
  • Strong verbal and written communication skills

 

Recruitment Process and Others

1. Recruitment Process: Application Review - Phone Interview - Onsite Interview - Offer  
(The recruitment process may be different depending on the job and may be changed due to scheduling and circumstances.)
2. Others:
a. This job post may be closed early if all openings are filled.   
b. If there is any false information in the application, the offer may be cancelled.
c. Veteran status or disability will not result in any disadvantages in the recruitment process.
d. Interview schedules and the results will be informed to the applicant via the e-mail address submitted at the application stage.

 

Recruiter: Nana Oh (jinaoh@couapng.com)

Sign up for job alerts

Interested InSelect a job category from the list of options. Select a location from the list of options. Finally, click “Add” to create your job alert.