티스토리 뷰

정시 점수공개 표본을 분석하기 위한 분석 엑셀 파일은 저번 글에서 받으실 수 있습니다.

정시 점수공개 표본 분석기 엑셀 (진학사) (http://itmir.tistory.com/646)




대학 정보 시트

표본을 분석할 대학의 이름, 학과 이름 등을 입력하는 대학 정보 시트입니다.



1) 대학 이름학과 이름은 진학사 점수 공개에 있는 그대로 입력해야 합니다.

또는, 정렬된데이터 시트에 나와있는 그대로 입력해야 합니다.

필수 입력 사항이며, 이를 입력하지 않을 경우에는 표본의 123지망 대학 중, 어느 대학이 분석 대상 대학인지 알 수 없어 확률을 계산할 수 없습니다.


2) 모집 인원은 간단히 말하면, 최초합격자 수입니다. 원래 정시 모집 인원과 수시 이월 인원이 합쳐진 수를 넣으시면 됩니다.


3) 전체 지원 인원은 해당 학과에 정시 원서를 넣은, 모든 지원자의 수입니다.


4) 모집 인원전체 지원 인원을 입력하면, 아래에 경쟁률이 자동으로 계산되서 표시됩니다.


5) 합격 예상 컷은 진학사와 같은 유료 합격 예측 프로그램을 이용하셔서 최종 컷을 아시는 분께서 사용하시는 칸입니다.

합격 예상 컷을 입력할 경우, 정렬된 데이터 시트에서 맨 오른쪽에 있는 "차이" 부분이 나타나면서 해당 표본이 최종 컷과 몇 점 차이나는지 계산됩니다.

또한, 예상 컷을 입력할 경우, 예상 컷과 가장 가까운 표본의 등수를 표시합니다. (살구색)


6) 로우데이터 시트에 정보를 입력하면, 점수 공개 표본 수가 계산되고, 이를 통해 점수를 공개한 사람들의 비율을 계산해서 표시합니다.


7) 예상 범위 (%)가 이 글을 쓰려고 마음 먹은 이유입니다.

최초 합격자 중에서 몇 %가 점수를 공개했을까?에 해당하는 %가 바로 예상 범위입니다.


예를 들어 보겠습니다. 모집 인원(즉, 최초 합격자 수)이 30명인 학과가 있다고 합시다.

이때, 최초 합격자 중에서 진학사에 점수를 공개한 사람들이 15명이라고 한다면, 절반(50%)이 점수를 공개한 것이죠?

이 경우에서 50%가 바로 예상 범위입니다.

점공 표본을 본다면, 1등부터 15등까지 표본이 최초합격이라고 생각할 수 있겠죠?


최초 합격자 중에서 몇 명이 점수를 공개했을까?를 파악하는게 쉽지 않기 때문에 저는 일부로 60(%)이라는 값을 넣어서 배포했습니다.

제가 가나다군 데이터를 넣어서 살펴보니 예상 범위를 50-60이라고 할 때가 예상 합격 등수가 진학사 컷이랑 가장 비슷하더라고요.

예상 합격 등수는 아래 확률표 시트에서 이어서 다루겠습니다.



확률표 시트

확률을 조절하거나, 합격 등수를 확인하는 확률표 시트입니다.


먼저 보정확률표에 대해 알아보겠습니다.



위의 스크린샷은 보정 확률표 스크린샷입니다.

제가 나름대로 확률을 넣어봤는데, 마음에 안드신다면 이 확률표를 수정해주시면 됩니다.


엑셀 파일 옆에도 설명이 있지만, 보정확률표에 대해 조금 더 보충해서 설명해보겠습니다.


정렬된 데이터 시트에서 한 표본의 123지망 합불 여부를 생각할 수 있습니다. (아래에서 다룸)

이때, 표본의 123지망 합격 여부가 1지망:합격, 2지망:불합격, 3지망:합격이라고 한다면 j101이 됩니다.


그리고, 분석 대상 대학(대학정보 시트에서 작성한 대학)이 3지망이라면, 해당 표본의 확률은 40이 됩니다.



이를 이해하려면, 제가 만들어낸 "등록확률"에 대해 생각해보시면 됩니다.

저는 어떤 표본이 분석 대상 대학에 등록할 확률을 등록확률이라고 명명했습니다.



예를 들어보겠습니다.


건국대 **과의 점공을 보고 있다면 분석 대상 대학은 건국대가 됩니다.

이때, 1지망 연대, 2지망 중앙대, 3지망 건국대를 지원한 한 표본이 있다고 생각해봅시다.


이 표본에게 주어지는 기본적인 확률은 123지망에 모두 합격했을 때, 분석 대상 대학이 3지망이므로 j111의 3지망으로 20%의 확률입니다.

그런데, 여러분께서 생각하시기에 12지망 합격이 힘들 것 같다. 스나를 노린 표본이다.라고 생각하신다면

12지망의 합격을 불합격으로 수정해주시면 됩니다. (정렬된 데이터 시트 참고)

그럴 경우, 이 표본이 분석 대상 대학(건국대)에 최종 등록하게 될 가능성이 높다고 생각하기때문에 j001의 3지망으로 70%의 확률을 받게 됩니다.



상위 표본의 등록 확률을 계산해서, 몇 명이 빠질까?, 즉 몇 명의 등록 확률이 낮을까?를 계산하는게 이 엑셀의 주요 목적입니다.





이어서 예상 합격 인원예상 합격 등수를 알아보겠습니다.



1) 정시 합격 인원은 대학정보 시트에 입력한, 모집인원이랑 같습니다. 즉, 최초 합격 인원이죠.


2) 예상 합격 인원을 계산할 때, 대학정보 시트의 "예상 범위"가 사용됩니다.

예상 합격 인원은 한마디가 빠졌는데, 정확히 말하면 "점공 표본 중에서 예상 최초 합격 인원" 입니다.


식 : 예상 합격 인원 = 최초합격자수 X 예상범위(%) X 0.01


모든 지원자가 진학사 점수공개를 하는 것이 아니기 때문에...

점공 표본 중에서 몇 등까지 최초 합격자일까?를 계산하는게 확률표의 예상 합격 인원입니다.


당연히 예상 범위를 수정하시면 예상 합격 인원도 달라지겠죠?

위에서도 말씀드린 것처럼, 예상 범위를 알기 힘들기 때문에 수정 가능하게 했고, 기본 값 60으로 계산하게 만든겁니다.


3) 예상 합격 등수는 비유하자면, 추가 합격 돌린 최종 컷이라고 할 수 있습니다. (가장 만들기 힘든 기능이었어요...ㅠ)

예상 합격 인원 19명이 나왔습니다.

이는 점공 표본 중에서 1등~19등까지가 최초 합격자라고 생각할 수 있어요.

그런데, 이 19명중 다른 대학으로 빠질 표본이 있다면?


예상 합격 등수는 등록 커트라인 확률 미만의 표본을 제외하고 계산했을때, 19번째 등수가 무엇인지 알려줍니다.

저 스크린샷으로 설명해보면..


최초합 인원은 1-19등. 이때, 1-19등 중에서 다른 대학으로 빠질 표본을 제외하고 19번째 등수가 바로 28등이라는 뜻입니다.


예상 합격 등수는 정렬된 데이터 시트에서 파란색 바탕으로 표시됩니다.


4) 합격 예상 컷은 대학정보 시트에서 입력한 최종 합격 컷 점수와 가장 근접한 등수를 표시합니다.




정렬된 데이터 시트

실제로 표본을 확인하는 공간이며, 123지망 대학의 합불여부를 결정하는 정렬된 데이터 시트입니다.

여기서 수정이 필요한 곳은 111이 가득한 곳 뿐입니다.



먼저 표본의 합불 여부 수정에 대해 알아보겠습니다.


기본적으로 분석 대상 대학에 최종 등록할 확률은 다음과 같이 정합니다.


1. 모든 표본은 123지망 대학에 전부 합격한다고 가정한다.

2. 이때, 123지망 대학을 신뢰하여, 어떤 표본이 13지망에 합격했을 때 3지망대학보다 1지망 대학에 갈 확률이 높다고 계산한다.

3. 분석 대상 대학이 해당 표본에게 몇 지망인가?에 따라 확률을 다르게 준다.


그런데 스나를 노리는 표본 등 1지망, 또는 12지망에 합격하기 힘들다고 생각할 수 있습니다.

이때 보정을 하지 않을 경우 해당 표본이 분석 대상 대학(3지망)에 등록할 확률을 20%로 낮게 잡을 수 있죠.


이를 막기 위해서 111을 수정합니다.


값은 1과 0만 들어갈 수 있으며, 해당 표본이 2지망에 합격하기 어렵다고 생각한다면 2지망의 "1"을 "0"으로 바꿔주면 됩니다.


이렇게 합불 여부가 바뀌게 되면, 확률표 시트에서 본 보정 확률표에 따라 확률을 주게 됩니다.




합격컷과의 차이에 대해 알아보겠습니다.


대학정보 시트에서 합격 컷을 입력하셨다면, 해당 표본의 점수와 최종 합격 컷과의 차를 구해서 표시합니다.




색깔로 표시되는 합격 등수를 알아보겠습니다.


파란색 등수 (스크린샷에서의 14등) : 확률표 시트의 예상 합격 등수를 표시합니다.


살구색 등수 (스크린샷에서의 17등) : 대학정보 시트에 입력한 합격 컷과 가장 근접한 표본을 표시합니다.


참고로 파란색과 살구색이 겹친다면? 파란색만 나타납니다.




기본 확률에 대해 알아보겠습니다.


분석 대상 대학이 해당 표본에게 몇 지망인가?에 따라 확률을 표시합니다.

아무 것도 수정하지 않았다면, 1지망은 80%, 2지망은 50%, 3지망은 20%가 기본 확률입니다.

이 확률 값은 해당 표본에게 분석 대상 대학은 몇 지망인가?를 알아보는데 사용합니다.


확률표 시트에서 80%, 50%, 20%를 수정할 수 있습니다.


댓글
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
Blogger Info