위즈wiz
데이터에듀 31회 오답노트 본문
2번 문제
다음 데이터 분석 조직의 유형 중 별도의 분석 조직이 없고 해당 업무부서에서 분석을 수행하는 방식에 해당하는 것은?
1. 집중구조 : 전사 분석 업무를 별도의 분석 전담 조직에서 담당
2. 기능구조 : 해당 업무 부서에서 분석 수행, 전사적 차원은 아님
3. 분산구조 : 분석조직 인력을 현업부서로 직접 배치, 전사적 차원이고, 업무과다 이원화 가능성 있음

6번문제
아래에서 빅데이터 시대의 위기와 통제에 대한 설명으로 가장 타당한 것끼리 묶은 것은?
사생활 침해(동의점에서 책임제로 전환)
- 사생활 침해에 대한 근본요인을 차단할 수 있어 빠른 기술 발전이 필요하다 (데이터 익명화)
- 사생활 침해를 방지하기 위해 데이터에 포함된 개인 식별 정보를 삭제하거나 알아볼 수 없는 형태로 변환
- 개인정보 사용자의 정보사용에 대한 무한책임의 한계로 개인정보사용 동의제보다 책임제를 더욱 강화해야 한다.
데이터 오용 (알고리즘 접근 허용 및 객관적인 인증 방안 도입)
- 빅데이터 분석은 일어난 일에 대한 데이터에 의존하므로 예측의 정확도는 높지만 항상 맞을 수는 없어 데이터 오용의 피해가 발생할 수 있다.
- 데이터 과신, 지표 사용으로 잘못된 인사이트를 얻어 비즈니스에 직접 손실 발생
- 빅데이터가 발생시키는 문제를 중간자 입장에서 중재하며 해결해주는 알고리즈미스트라는 새로운 직업으로 부상하게 될 것이다.
책임원칙의 훼손(결과기반 책임 원칙 고수)
- 민주주의 국가의 형사처벌과 같이 잠재적 위협이 아닌 명확하게 행동한 결과에 대해 책임을 묻기 때문에 빅데이터 사전 성향 분석을 실시한다면 책임 원칙을 훼손한다.
- 분석 대상이 된 사람들은 예측 알고리즘의 희생양이 될 가능성 증가
- ex> 범죄 예측 프로그램을 통해 범죄 전에 체포
7번 문제
다음 중 데이터 베이스의 특징과 가장 거리가 먼 것은?
데이터 종속성
데이터 종속성이란 응용 프로그램과 데이터 간의 상호 의존 관계를 말한다. 데이터 파일이 보조 기억장치에 구성되는 방법이나 저장된 데이터의 접근 방법이 각 응용 프로그램 속에 명세되어야 하는 상황에서 자연히 응용 프로그램은 접근하려는 데이터의 구성 방법이나 접근 방법에 맞게 작성되어야 한다. 따라서 데이터의 구성 방법이나 접근 방법을 변경 시킬 때는 자연히 이것을 기초로 한 응용 프로그램도 같이 변경해야 하는데 이것을 데이터 종속성이라고 한다.
데이터 중복성
현실 세계에서 실제로 어느 한 응용 프로그램이 사용하는 데이터를 또 다른 응용 프로그램이 사용할 수 있도록 하면 아주 편리한 경우가 상당히 많이 있다. 때에 따라서는 이프로그램들은 똑같은 내용의 데이터를 똑같은 양식에 똑같은 구조로 사용하는 경우도 있고, 때에 따라 내용의 데이터를 양식과 구조만 다르게 사용하는 경우도 있다,
데이터베이스는 종속성과 중복성을 배제한다. 데이터 종속성이란 응용프로그램별로 데이터를 별도 관리한다
12번 문제
다음 중 프로토 타이핑 방법론의 기본적인 프로세스와 가장 관련이 없는 것은?
프로토 타이핑 방법론은 소프트웨어 개발 과정에서 초기단계에 사용자 요구사항을 명확히 하고 이를 바탕으로 초기 버전의 제품인 프로토 타입을 신속하게 개발하여 사용자의 피드백을 받는 방식
이 모델은 주로 사용자의 요구사항이 불분명하거나 변경 가능성이 높은 프로젝트에 적합
프로토타이핑 접근법의 기본적인 프로세스:
1. 가설의 생성
2. 디자인에 대한 실험
3. 실제환경에서의 테스트
4. 테스트 결과에서의 통착 도출 및 가설 확인으로 구성
15번 문제
분석을 사용하여 전략적 통찰력을 얻기 위한 방법으로 부적절한 것은?
데이터 중심의 통찰력
1. 조달 프로세스의 개선을 위해 활용될 수도 있다
2. 과거 데이터와 현재 데이터를 비교하고 예츨 모델을 만들어 미래의 조달 요구사항을 예상할 수 있다. 이를 통해 재고관리, 공급처 선택, 가격 협상 등에 대한 전략을 수립할 수 있다
3. 조달 프로세스의 효율성을 측정 및 평가할 수 있다. 예를들어 구매 주문의 처리 시간이 오래 걸린다면 해당 단게에서의 병목 현상을 찾아 개선할 수 있다
4. 조달 프로세스에서의 의사 결정에 도움을 준다.
5. 객관적인 데이터를 기반으로한 의사 결정은 조달의 효율성과 효과성을 증가시킬 수 있다
6. 데이터의 수집과 분석, 개선과 의사 결정에 활용되는 데이터 중심의 통찰력은 조달 프로세스를 효율적으로 관리하며 성공적인 조달 전략 수립을 돕는 중요한 도구이다
7. 경영의 본질을 제대로 바라볼 수 있도록 분석한다.
8. 경영진은 직관적 결정을 지양하고 데이터 기반의 객관적 의사결정을 한다.
9. 비즈니스의 핵심가치와 관련된 분석 프레임워크와 평가지표를 개발한다.
10. 전략적 통찰력을 얻기 위해서는 내부뿐만 아니라 외부환경을 같이 분석해야한다
25번 문제
다음 중 대용량 데이터 속에서 숨겨진 지식 또는 새로운 규칙을 추출해 내는 과정을 일컫는 것은?
데이터 마이닝 : 대규모로 저장된 데이터 안에서 체계적이고 자동적으로 통계적 규칙이나 패턴을 분석하여 가치있는 정보를 추출하는 과정이다. 다른말로는 데이터 베이스 속의 지식 발견 이라고도 일컫는다
지식 경영 : 조직 내 지식의 발굴, 공유 및 적용을 통해 조직의 문제해결 역량을 향상시킴으로써 경쟁 우위를 갖추게 하는 프로세스
의사결정 지원 시스템 : 조직이나 개인이 복잡한 결정을 내릴 때 과학적이고 체계적인 지원을 제공하는 도구, 정보 기술과 데이터 분석 기술의 발전으로 인해 의사결정 지원 시스템은 조직의 효율성과 정확성을 향상시키는데 중요한 역할을 하고 있다. 이 시스템은 의사결정 과정의 모든 단계에서 정보를 수집, 분석하여 최적의 결정을 도와준다
데이터 웨어 하우징 : 개방형 시스템 도입으로 흩어져 있는 각종 기업정보를 최종 사용자가 쉽게 활용, 신속한 의사결정을 유도하도록 해 기업내 흩어져 있는 방대한 양의 데이터에 쉽게 접근하고 이를 활용할 수 있게 하는 기술을 말한다
30번 문제
모집단을 특정한 기준에 따라 서로 상이한 소집단으로 나누고 각각의 소집단으로부터 일정한 표본을 무작위로 추출하는 표본추출방법으로 적절한 것은?
단순랜덤추출법(단순임의추출법):
유한모집단에서 k개의 추출 단위로 구성된 모든 부분 집합들이 선택될 확률이 같도록 설계된 표본 추출방법이다
계층추출법:
모집단을 몇개의 층으로 나누고 각 계층에서 상호 독립적으로 표본을 임의 추출하는 방법
집락(군집)추출법:
모집단이 가진 특성을 고려하지 않고 모집단의 구성단위를 몇 개의 집락으로 나눈뒤 무작위로 추출하는 방법
층화 추출법 :
이질적인 원소들로 구정된 모집단에서 각 게층을 고루 대표 할 수 있도록 표본을 추출하는 방법, 유사한 원소끼리 몇 개의 층으로 나누어 각 층에서 랜덤 추출하는 방법
32번 문제
다음 중 한 변수를 단조 증가 함수로 변환하여 다른 변수를 나타낼 수 있는 정도를 나타내며 두 변수의 선형 관계의 크기뿐만 아니라 비선형적인 관계도 나타낼 수 있는 상관계수는 무엇인가?
코사인 유사도 :
두 벡터 간의 코사인 각도를 이용하여 구할 수 있는 두 벡터의 유사도를 의미
피어슨 상관계수 :
두 변수 x와 y간의 선형 상관 관계를 계량화한 수치이다. 코시 슈바르츠 부등식에 의해 +1과 -1 사이의 값을 가지며, +1은 완벽한 양의 선형 상관관계, 0은 선형 상관 관계 없음, -1은 완벽한 음의 선형 상관 관계를 의미한다. 일반적으로 상관 관게는 피어슨 상관관계를 의미하는 상관계수이다
스피어만 상관계수 :
두 변수의 순위 사이의 통계적 의존성을 측정하는 비모수적인 척도이다. 이는 두 변수의 관계가 단조함수를 사용하여 얼마나 잘 설명될 수 있는지를 평가한다. 단조적이지만 비선형적인 관계를 측정할때 사용
자카드 인덱스 :
두 집합 사이의 유사도를 측정하는 방법중 하나
35번 문제
에어컨 회사에서 지역별 온도, 습도에 따라 고객군을 눠서 마케팅 전략을 수립할 때 적합한 분석 방법은?
연관 분석 :
어떤 두 아이템 집함이 번번히 발생하는 가를 알려주는 일련의 규칙들을 생성하는 알고리즘, 장바구니 분석이라고도 알려졌다
회귀분석 :
매개변수 모델을 이용하여 통계적으로 변수들 사이의 관계를 추정하는 분석방법이다. 주로 독립변수가 종속변수에 미치는 영향을 확인하고자 사용하는 분석방법이다. 회귀분석은 다른 독립변수들을 고정시키고 한가지 독립변수만을 변화시킬 때 종속변수가 어떻게 변화하는지를 확인한다. 종속변수와 관련이 있는 독립변수를 찾을 때, 또 독립변수들 간의 관계를 이해하고자 할 때 사용한다
군집분석 :
데이터 간의 유사도를 정의하고 그 유사도에 가까운 것부터 순서대로 합쳐가는 방법으로 유사도의 정의에는 거리나 상관계수 등 여러가지가 있다
분류분석 :
사전에 정의된 둘 이상의 집단의 차이를 분류할 수 있는 분류기를 찾아내는 훈련의 방법, 데이터 세트의 개별 관측값들이 어느 집단에 속하게 될 지를 결정하는 방법
38번 문제
다음 중 다중공선성에 대한 설명으로 가장 부적절한 것은?
다중공선성 :
1. 회귀분석에서 사용된 모형의 일부 예측 변수가 다른 예측 변수와 상관 정도가 높아 데이터 분석 시 부정적인 영향을 미치는 현상
2. 입력변수들 간의 상관 관계가 존재하여 회귀계수의 분산을 크게 하기 때문에, 회귀 분석시 추정 회귀 계수를 믿을 수 없게 되는 문제가 발생
3. 다중 회귀 모형에서 회귀 계수란 독립변수의 변화에 따른 종속 변수의 변화량을 나타내기 때문에, 설명 변수들 사이에 유의미한 상관관계가 존재하는 경우 한 설명 변수를 다른 설명 변수와의 함수 관계로 표시할 수 있다
4. 회귀분석에서 설명 변수 중에 서로 상관이 높은 것을 포함되어 있을때는 분산.공분산 행렬의 행렬식이 0에 가까운 값이 되어 회귀계수의 추정 정밀도가 매우 나빠지는 일이 발생
5. 결정계수는 회귀모델에서 독립변수가 종속변수를 얼마나 잘 설명하는지를 나타내는 것으로 회귀식의 기울기와는 관계가 없다.
6. 다중공선성 문제를 해결하기 위해 중요하지 않으면서 다른 변수와 상관성이 높은 변수를 제거한다.
7. 표본 수가 증가해도 VIF에서 일반 결정계수는 크게 변하지 않는다.
8. 구조적 다중공선성의 문제가 있는 경우에는 데이터의 평균 중심을 변화한다.
39번 문제
시계열의 요소분해법은 시계열 자료가 몇 가지 변동들의 결합으로 이루어져 있다고 보고 변동 요소 별로 분해하여 쉽게 분석하기 위한 것이다. 다음 중 분해 요소에 대한 설명이 부적절한 것은?
추세분석(T) : 데이터가 장기적으로 증가하거나 감소하는 경향
계절변동(S) : 일정한 주기로 반복되는 패턴을 보이는 변화
순환변동(C) : 계절변동과 유사하게 변화하나 그 변화의 주기가 길 때의 변동을 의미하며 경기변동이라고 부르며 단 그 주기는 일정하지 않다. 경기나 어떤 기업의 호황, 불활 등을 나타낼때 사용하기도 한다. 경제적이나 자연적인 이유 없이 알려지지 않은 주기를 가지고 변화하는 자료를 의미
불규칙변동(I) : 시간과 관계없이 설명하기 어려운 여러가지 복합적인 원인에 의한 변동이며 에측할 수도 없고 관심의 대상도 아니다
40번 문제
주성분 분석은 p개의 변수들을 중요한 m(p)개의 주성분으로 표현하여 전체 변동을 설명하는 방법을 사용한다. 다음 중 주성분 개수(m)를 선택 방법에 대한 설명으로 가장 부적절한 것은?
평균 고윳값 방법 :
고윳값들의 평균을 구한후 고윳값이 평균값 이상이 되는 주성분을 제거하는 것이 아니라 설정하는 것이다.
전체 변이 공헌도 방법 :
전체 변이의 70~90% 정도가 되도록 주성분의 수를 결정한다
scree graph를 이용하는 방법 :
고윳값의 크기순으로 산점도를 그린 그래프에서 감소하는 추세가 원만해지는 지점에서 1을 뺀 개수를 주성분의 개수로 선택한다
주성분은 주성분을 구성하는 변수들의 계수 구조를 파악하여 적절하게 해설되어야 하며, 명확하게 정의된 해석 방법이 있는 것은 아니다
단답1번 문제
인공지능의 한 분야로, 컴ㅍ터가 스스로 많은 데이터를 분석해서 패턴과 규칙을 찾아내고, 학습된 패턴과 규칙을 활용하여 분류나 예측을 하는 것을 무엇이라고 하는가?
머신러닝(기계학습)
단답2번 문제
조직 내 구성원들이 축적하고 있는 노하우 등 암묵적 직식을 형식지로 표출화 될 수 있도록 지원 하는 등, 조직의 경쟁력 향상을 위해 지식 자원을 체계화하고 원활하게 공유가 될 수 있도록 지원 하는 시스템을 무엇이라고 하는가?
KMS(지식경영시스템)
단답 3번 문제
기업 및 공공지간에서는 중장기 로드맵을 정의하기 위한(ISP)을 수행한다. (ISP)은 정보기술 또는 정보 시스템을 전략억으로 활용하기 위하여 조직내외부 환경을 분석하여 기회나 문제점을 도출하고 사용자의 요구사항을 분석하여 시스템 구축 우선순위를 결정하는 등 중장기 마스터 플랜을 수립하는 절차이다.
단답 4번 문제
데이터 분석 도입의 수준을 파악하기 위한 분석 준비도의 6가지 구성요소 중 하나로서 운영시스템 데이터 통합, 빅데이터 분석 환경, 통계분석 환경 등을 진단하는 구성요소는 무엇인가?
IT인프라
단답 5번 문제
베이즈 정리와 특징에 대한 조건 독립을 가설로 하는 알고리즘으로 클래스에 대한 사전 정보와 데이터로부터 추출된 정보를 결합하고 베이즈 정리를 이용하여 특정 데이터가 특정 클래스에 속하는지를 분류하는 알고리즘은 무엇인가?
나이브 베이즈 분류
단답 7번 문제
텍스트 마이닝에서 어근에 차이가 있더라도 관려니 있는 단어들을 동일한 어간으로 매핑이 될 수 있도록 정해진 규칙에 따라 단어에서 어간을 분리하여 공통 어간을 가지는 단어를 묶는 작업을 무엇이라고 하는가?
스테밍(어간 추출)
단답 10번 문제
원 데이터 집합으로부터 크기가 같은 표본을 여러 번 단순 임의 복원 추출하여 각 표본에 대해 분류기를 생성한 후 그 결과를 앙상블하는 방법을 무엇이라 하는가?
배깅(bagging)
'공부 > ADsP' 카테고리의 다른 글
에듀아토즈 ADsP 40회 오답노트 (2) | 2024.08.07 |
---|---|
데이터 에듀 32회 오답노트 (1) | 2024.08.06 |
데이터 에듀 ADsP 30회 오답 노트 (0) | 2024.08.02 |
데이터 에듀 39회 오답노트 (0) | 2024.07.26 |
ADsP 데이터 에듀 모의1 오답노트 (1) | 2024.07.20 |