•  

IST Learning

Let's Learn Together

  • Home
  • Courses
    • IST Courses
      • IST 110
      • IST 140
      • IST 210
      • IST 220
      • IST 230
      • IST 234
      • IST 235
      • IST 237
      • IST 240
      • IST 242
      • IST 250
      • IST 256
      • IST 261
      • IST 301
      • IST 302
      • IST 311
      • IST 331
      • IST 337
      • IST 361
      • IST 389
      • IST 402
      • IST 411
      • IST 412
      • IST 413
      • IST 420
      • IST 421
      • IST 423
      • IST 432
      • IST 437
      • IST 440W
      • IST 441
      • IST 446
      • IST 451
      • IST 452
      • IST 454
      • IST 456
      • IST 461
      • IST 489H
    • SRA Courses
      • SRA 111
      • SRA 211
      • SRA 221
      • SRA 231
      • SRA 311
      • SRA 365
      • SRA 421
      • SRA 433
      • SRA 440W
      • SRA 468
      • SRA 471
      • SRA 472
      • SRA 480
    • DS Courses
      • DS 120
      • DS 200
      • DS 220
      • DS 300
      • DS 310
      • DS 320
      • DS 330
      • DS 340W
      • DS 402
      • DS 410
      • DS 440
    • Cyber Courses
      • Cyber 100
      • Cyber 262
      • CYBER 342W
      • Cyber 362
      • CYBER 366
      • CYBER 440
    • HCDD Courses
      • HCDD 113
      • HCDD 264
      • HCDD 340
      • HCDD 364W
      • HCDD 440
    • LionPath Course Catalog
  • Resources
    • Learning Resources
    • IT Certifications
    • IST Advising Center
    • Recommended Academic Plans
    • Office of Career Solutions
    • Diversity at IST
    • Curricular Goals for Undergrads
  • New Students
    • Non-IST Course Support
    • Student Support Services
    • Technology Resources
    • The Study Cycle
    • Library Resources
    • Professional Communication
  • Tutoring
    • University Park Tutoring
    • World Campus Tutoring
    • Peer Tutoring Application
    • Meet Our Tutors
    • Peer Tutor Job Description
    • Programming Resources
  • Workshops
    • Programming Workshops
    • Noon Learning Series Workshops
    • Previous Recorded Workshops
  • LAs
    • LA Job Description
    • LA Application
    • LA Resources & Forms
    • Meet Our LAs
    • Past LAs
  • Contact Us

CORONAVIRUS UPDATES:

Tutoring remains open for students in College of IST courses—see the tutoring tab for details. The College is accepting LA applications for Spring 2021—see the Learning Assistant tab for details. Keep up with Penn State's Keep Learning site for remote instruction along with College resources. Penn State also has a general page on information about the global coronavirus outbreak.

DS 200


Introduction to Data Science


Sample Syllabi
  • DS 200 – FA16 – Yen
Course Materials
  • University Bulletin
Course Connections

Prerequisites

  • None

Follow-Ons

  • None

Course Composition and Objectives

  • Upon completion of the course, you should be able to gain first-hand experiences about a mini data science project. More specifically, you will:
    • Be able to design an exploratory data science project using Tweets and assess its feasibility (using visualization tools).
    • Be able to use Twitter API to gather tweets of interest for the project
    • Be able to use a tool (Weka) to analyze twitter data
    • Be able to use tools to visualize data and the models they generate
    • Be able to generate a decision-tree predictive model for classifying tweets automatically using a tool (Weka)
    • Be able to generate a probabilistic predictive model for classifying tweets automatically using a tool (Weka)
    • Be able to evaluate and compare the performance of predictive models
  • You will be able to understand and apply the following concepts related to exploratory data analysis:
    • R – Representation
    • I – Induction
    • S – Search
    • E – Evaluation
  • You should also be able to gain a conceptual understanding about some of the real-world applications such as:
    • The “Beer and Diaper” data mining story– The Discovery of Customer Purchase Patterns(The discovery of frequent association; exploratory data project; human behavior; conditional probability)
    • Amazon product recommendation based on reviews of others. (Similarity Measure; Collaborative Filtering; Recommendation Systems)
    • Google’s pre-processing of Web pages for Its Search Engine
    • Social Media analytics
    • Examples of data science applications in specific domains (e.g., health, social, security, life science).
  • Instructors Choice: Instructors may choose topics and learning objectives that meet the spirit of the course as defined here. Instructors may choose to devote more time to the learning objectives listed above or to add additional, complimentary objectives. Supplementary material and objectives should not overlap with the defined content of other courses in the curriculum.

Course Description

This course aims to achieve three goals:

  1. It will provide you with hands-on experiences about a data science project, which will enable you to extract meaningful information (relevant to a question/hypothesis of interests to you) from a large twitter dataset you gather.
  2. You will learn four key concepts regarding predictive modeling and exploratory data analysis: Representation, Induction, Simplification, and Evaluation (RISE). This understanding will provide you a framework for relating theories (e.g., logic, probability) to practical methods using these theories (e.g., decision-tree induction, Naives Bayes induction), and their applications to data sciences, and to your data science project in particular.
  3. You will learn the broader landscape of Data Sciences:
    • What global trends make Data Sciences important for our society?
    • What are the “types” of data science projects and how, together, they form the journey of a data science initiative?
    • What is the role of visual analytics in Data Sciences?
    • What are the foundations of Data Sciences for innovating solutions for analyzing massive datasets?
    • What should a Data Scientist know about data ethics?
    • What is the role of domain-specific knowledge in Data Science projects?

While we may only be “touching the surface” of these topics, they will be addressed and elaborated in other courses throughout your Data Science education experience at Penn State. Together, I hope these goals help to guide you as you start this exciting journey of becoming the “Next Generation Data Scientists”.

IST Courses

  • IST 110
  • IST 140
  • IST 210
  • IST 220
  • IST 230
  • IST 234
  • IST 235
  • IST 237
  • IST 240
  • IST 242
  • IST 250
  • IST 256
  • IST 261
  • IST 301
  • IST 302
  • IST 311
  • IST 331
  • IST 337
  • IST 361
  • IST 389
  • IST 402
  • IST 411
  • IST 412
  • IST 413
  • IST 420
  • IST 421
  • IST 423
  • IST 432
  • IST 437
  • IST 440W
  • IST 441
  • IST 446
  • IST 451
  • IST 452
  • IST 454
  • IST 456
  • IST 461
  • IST 489H

SRA Courses

  • SRA 111
  • SRA 211
  • SRA 221
  • SRA 231
  • SRA 311
  • SRA 365
  • SRA 421
  • SRA 433
  • SRA 440W
  • SRA 468
  • SRA 471
  • SRA 472
  • SRA 480

DS Courses

  • DS 120
  • DS 200
  • DS 220
  • DS 300
  • DS 310
  • DS 320
  • DS 330
  • DS 340W
  • DS 402
  • DS 410
  • DS 440

HCDD Courses

  • HCDD 113
  • HCDD 264
  • HCDD 340
  • HCDD 364W
  • HCDD 440

CYBER Courses

  • Cyber 100
  • Cyber 262
  • CYBER 342W
  • Cyber 362
  • CYBER 366
  • CYBER 440

Learning in IST


E101 Westgate Building
(814) 865-8947
learning@ist.psu.edu

Student Support Services

  • Learning Resources
  • College of IST Tutoring Sessions for University Park Students
  • IST Advising Center
  • Recommended Academic Plans
  • Office of Career Solutions
  • Diversity at IST
  • Curricular Goals for Undergrads

Learning Assistants

  • LA Introduction
  • LA Job Description
  • LA Application
  • LA Resources & Forms
  • Meet Our LAs
    • Past LAs

Questions?

  • Contact Us

IST Courses

  • IST 110
  • IST 140
  • IST 210
  • IST 220
  • IST 230
  • IST 234
  • IST 235
  • IST 237
  • IST 240
  • IST 242
  • IST 250
  • IST 256
  • IST 261
  • IST 301
  • IST 302
  • IST 311
  • IST 331
  • IST 337
  • IST 361
  • IST 389
  • IST 402
  • IST 411
  • IST 412
  • IST 413
  • IST 420
  • IST 421
  • IST 423
  • IST 432
  • IST 437
  • IST 440W
  • IST 441
  • IST 446
  • IST 451
  • IST 452
  • IST 454
  • IST 456
  • IST 461
  • IST 489H

SRA Courses

  • SRA 111
  • SRA 211
  • SRA 221
  • SRA 231
  • SRA 311
  • SRA 365
  • SRA 421
  • SRA 433
  • SRA 440W
  • SRA 468
  • SRA 471
  • SRA 472
  • SRA 480

DS Courses

  • DS 120
  • DS 200
  • DS 220
  • DS 300
  • DS 310
  • DS 320
  • DS 330
  • DS 340W
  • DS 402
  • DS 410
  • DS 440

CYBER Courses

  • Cyber 100
  • Cyber 262
  • CYBER 342W
  • Cyber 362
  • CYBER 366
  • CYBER 440

HCDD Courses

  • HCDD 113
  • HCDD 264
  • HCDD 340
  • HCDD 364W
  • HCDD 440
  • Privacy
  • Non-Discrimination
  • Equal Opportunity
  • Accessibility
  • Legal

Copyright © 2021 · Education Pro Theme on Genesis Framework · WordPress · Log in