[BigContest] NS Shop+ ํ์ผํ ์ค์ ์์ธก
- ๋ถ์๊ธฐ๊ฐ: 2020 August ~ 2020 September
- ๋ณธ ๋ํ๋
BigContest์์ ์ฃผ์ตํ ๋ํ๋ก, NS Shop+์2020๋ 6์ ์ค์ ์ ์์ธกํ๋ ๊ฒ์ด ์ฃผ๋ชฉ์ ์ด์๋ค. - ๊ทธ๋ฆฌ๊ณ ์ด๋ฅผ ๋ฐํ์ผ๋ก ์ต์ ์์ต์ ๊ณ ๋ คํ ์์ผ๋ณ/์๊ฐ๋๋ณ/์นดํ
๊ณ ๋ฆฌ๋ณ
ํธ์ฑ ์ต์ ์ ๋ฐฉ์(๋ชจํ)์ ์ ์ํ๋ ๊ฒ๊น์ง๊ฐ ๋ํ ์๊ตฌ์ฌํญ์ด์๋ค. - ํ๊ฐ๋ฐฉ๋ฒ์
MAPE(Mean Abosolute Percentage Error) ํ๊ท ์ ๋๋น์จ์ค์ฐจ์๋ค.
My Role
1. ์ํ๊ตฐ๋ณ ๋ฐ์ดํฐ ํด์
- ์ํ์ฉํ, ๊ฐ๊ตฌ, ์นจ๊ตฌ, ๋ฌดํ ์นดํ ๊ณ ๋ฆฌ ๋ฐ์ดํฐ ํด์
- ์ํ๊ตฐ๋ณ๋ก ํน์ง์ด ๋ค๋ฅผ ๊ฒ์ผ๋ก ํ๋จ๋์ด ์ญํ ์ ๋ถ๋ดํ์ฌ ๋ฐ์ดํฐ ๋ถ์์ ์ค์ํ์๋ค.
2. ๋ ธ์ถ์๊ฐ ์ ์ฒ๋ฆฌ
- (1-1) ๋ฐ์ฌ๋ฆผ
- (1-2) Missing Value Imputation (
ffill) - (1-3) ๊ทธ๋ฃนํ
- (2-1) ๋ ธ์ถ์๊ฐ ๋์ ๋ฐ ์ดํฉ ๊ณ์ฐ
3. Business ๋ชจ๋ธ์ ์ ๋ง๋ ๋ฐ์ดํฐ ์ฒ๋ฆฌ
- ์ทจ๊ธ์ก = ํ๋งค๋จ๊ฐ X ์ฃผ๋ฌธ๋
- ์ทจ๊ธ์ก์ด ํ๋งค๋จ๊ฐ๋ณด๋ค ์์ ๊ฒฝ์ฐ๋ ์ค๋ฅ์ด๋ฏ๋ก, 0์์ผ๋ก ๋ณ๊ฒฝ
4. ์ํ๋ช ์ ์ฒ๋ฆฌ
- (1) ๋ธ๋๋ ์ถ์ถ
- (2) ์ธํธ ์ํ ์ฌ๋ถ
- (3) ์ํ๊ตฐ๋ณ ์๋ถ๋ฅ ์ถ์ถ
What I Have Learned
1. ์ค์ ๋ฐ์ดํฐ๋ ์๊ฐ๋ณด๋ค ์ค๋ฅ๊ฐ ๋ง๋ค.
- (My Role์ 3๋ฒ ์ฐธ๊ณ )
2. ์ ๊ณต๋์ง ์์ ์ ๋ณด๊ฐ ๋ง๋ค.
- ๋ค์ํ ํ ์ธ๊ฒฝ๋ก๋ก ์ธํด, ๊ณ ๊ฐ๋ง๋ค ํ ์ธ๋ฐ์ ๊ธ์ก์ด ๋ค๋ฅด๋ค.
3. ๋ถ๊ท ํ๋ฐ์ดํฐ Upsampling
- ์ํ๊ตฐ๋ณ ๋ฐ์ดํฐ ๊ฐ์๊ฐ ๋ฌ๋๋๋ฐ, ๋ถ์กฑํ ์นดํ ๊ณ ๋ฆฌ์ ๊ฒฝ์ฐ n๋ฐฐ ๋ฐ์ดํฐ์๋ฅผ ๋๋ ค์ฃผ์๋ค.
- ์ดํ SMOTE์ ๊ฐ์ ๋ฐฉ๋ฒ๋ก ์ด ์๋ค๋ ๊ฒ์ ์๊ฒ ๋์๋ค.
4. ํ์๋ณ์ ํ๋๊ฐ ์ฑ๋ฅ ํฅ์์ผ๋ก ์ด์ด์ง๋ค.
๋์ ๋ ธ์ถ์๊ฐ์ด ์ฑ๋ฅ ํฅ์์ ํฌ๊ฒ ๊ธฐ์ฌํ์๋ค.
5. Bayesian Optimization
- hyperparameter ์ ์ ์, ์ฌ์ ์ง์์ ํ์ฉํ๋ฉด ๋ณด๋ค ์ข์ ์ฑ๋ฅ์ผ๋ก ์ด์ด์ง ์ ์๋ค.
Difficulty
- ๋ฐ์ดํฐ๊ฐ ์ ์ ๋์ง ์๊ฑฐ๋ ์๋ชป ์ ์ ๋ ๊ฒฝ์ฐ๊ฐ ์์๋ค.
- ์ํ๊ตฐ๋ณ๋ก ํน์ง์ด ์์ดํ๋ค.
- ํ์ต๋ฐ์ดํฐ์ ์กด์ฌํ์ง ์๋ ์ ๋ณด๊ฐ ํ๊ฐ๋ฐ์ดํฐ์ ์กด์ฌํ๋ค.
- ์ฝ๋ก๋๋ก ์ธํ ์ํฅ์ ๊ณ์ฐํ๊ธฐ ์ด๋ ค์ ๋ค.
Result
Best Broadcasting Schedule Suggestion
- ์ํ๊ตฐ๋ณ PRIME TIME ์ ์
- Prime Time์ด๋, ํด๋น ์ํ๊ตฐ์ด ๊ฐ์ฅ ์ธ๊ธฐ์๋ ์๊ฐ๋๋ฅผ ์๋ฏธํ๋ค.
- ์ํ๊ตฐ๋ณ ์ถ์ฒ ์ํ
- ๋งค์ถ์ก์ ํฐ ๋ถ๋ถ์ ์ฐจ์งํ๋ ์ํ๋ค์ Prime Time์ ๋ฐฐ์นํ๋ค.
- ๊ตฌ๋งค์๋์ ์ํฅ์ ๋ฐ๋ ์ํ๋ค์ ๋น๊ต์ ์ ๋งคํ ์๊ฐ๋์ ๋ฐฐ์นํ๋ค.
- EX) ์๋ฅ์ ๊ฒฝ์ฐ, prime time์ ์ฌ์นํ(๋ค์ด์ฝํธ, ๋ฐํฌ์ฝํธ)์ ํ๋งคํ๊ณ , ๊ทธ์ธ ์๊ฐ๋์๋ ๊ธฐ๋ณธ ์์ดํ (ํ๋ฆฌ์ค ์์ผ, ํฐ์ ์ธ )์ ํ๋งคํ๋ค.
Presentation